一种网络搜词方法及系统的制作方法

文档序号:6483615阅读:224来源:国知局
专利名称:一种网络搜词方法及系统的制作方法
技术领域
本发明涉及网络翻译领域,具体涉及 一种网络搜词方法及系统。
背景技术
随着社会科技与经济的飞速发展,不同语种之间的信息交流已经成为信息交往中的重要部分,随之而来的各种翻译需求也越来越广泛。网络词汇翻译工具像谷歌、金山词霸、灵格斯、海词等都是我们工作中常用到的,每个软件都有自身的特点,如何在使用中的过程扬长避短,发挥各工具的最大优点是用户最关心的,通常用户在搜词过程中总是先在一个工具中搜索后,再到另外一个工具中进行搜索,这样的操作在不经意间增加了用户的工作量,降低了工作效率。

发明内容
本发明的目的是提供 一种让用户在最短时间内和最简洁的方式下搜索词汇的方法和系统。
为实现上述目的,本发明釆用如下技术方案一种网络搜词方法,该方法包括步骤
51. 建立与多个网站的链接;
52. 获取用户提交的待搜索单词、查询条件以及网站信息;
53. 将所述单词提交到用户指定的网站,等待返回结果,对所述返回结果进行编码;
54. 根据HTML标签,截取所述返回结果中的解释内容,按设定的模式对所述解释内容进行拆分,并将拆分后的内容放入对应字符串数据集中汇总;
55. 若用户继续指定对所述单词需进行搜索的网站,则返回步骤S3,否则执行步骤S6;
4S6.保存本次搜索的所有结果到解释数据集,并输出。其中,步骤S4进一步包括
S4.1对所述编码后的返回结果进行字符查找,根据HTML标签截取解释内容放入临时数组;
S4.2将所述放入临时数组的解释内容按照HTML标签以分内容、
分段、分行的模式进行打散处理,并将打散后的内容放入各自的临时数组;
S4.3对所述打散的内容逐一按字符串进行去重检查,并添加到对应的字符串数据集中汇总。
其中,所述指定网站为一个或多个。
其中,步骤S3中若无返回结果,则返回步骤S2获取用户重新提交的网站信息,或重新提交的待搜索单词、查询条件以及网站信息。
其中,所述步骤S4.1中根据HTML标识截取解释结果内容放入临时数组时要对所述内容进行正则处理,剔除网页格式的代码,只将解释内容放入所述临时数组。
其中,所述步骤S4.2分内容中的内容为单词的词性、释义以及例句。
其中,所述步骤S4.3中,若所述数据集中所述打散的内容的字符串不存在,则添加该字符串,若已存在,则不进行任何处理。
一种网络搜词系统,该系统包括链接模块,用于建立与多个网站的链接;获取模块,用于获取用户提交的待搜索单词、查询条件以及网站信息;输入模块,用于将所述单词提交到用户指定网站,对返回结果进行编码;拆分、汇总模块,根据HTML标签,截取所述返回结果中的解释内容,按设定的模式对所述解释内容进行拆分,并将拆分后的内容放入对应的字符串数据集中汇总;输出模块,用于保存
一次搜索的所有结果到解释数据集,并输出。
其中,所述拆分、汇总模块进一步包括截取子模块,对所述编码后的返回结果进行字符查找,根据HTML标签截取解释内容放入临时数组;拆分子模块,将所述放入临时数组的解释内容按照HTML标签以分内容、分段、分行的模式进行打散处理,并将打散后的内容放入各自的临时数组;去重、汇总子模块,对所述打散的内容逐一按字符串进行去重检查,并添加到对应的结果字符串数据集中。


图1为本发明的网络搜词方法流程图;图2为对解释内容进行拆分的流程图;图3为本发明的网络搜词系统构成框图。
具体实施例方式
本发明提出的网络搜词方法及系统,结合附图和实施方式详细说明如下。
如图1所示,本实施方式的网络搜词方法可 一次从多个网站获取单词的解释内容,并分类,以最快的速度得到用户想要的结果,该方法包括步骤
51. 建立与多个网站的链接;
52. 获取用户提交的待搜索单词、查询条件以及需进行查询的搜索网站信息;
53. 将待搜索的单词提交到用户指定的网站,等待返回结果,对返回结果进行编码,若无返回结果,则返回步骤S2,获取用户重新提交的其他网站的信息,或重新提交的待搜索的其他单词、查询条件以及需搜索的网站的信息,并对返回结果进行编码,以便接下来要进行的处理;
54. 根据HTML标签,截取返回结果中的解释内容,按设定的模式对解释内容进行拆分,并将拆分后的内容放入对应的字符串数据集中汇总;
55. 若还需对单词进行其他网站的搜索,则返回步骤S3,否则执行步骤S6;
S6.清理各临时数据组,保存本次搜索的所有结果到解释数据 集,按照规定的排版格式将解释数据集中的结果显示输出。 其中,如图2所示,步骤4进一步包括
S4.1对编码后的返回结果进行字符查找,根据HTML标签截取解 释内容放入临时数组;
S4.2将放入临时数组的解释内容按照HTML标签以分内容、分 段、分行的模式进行打散处理,并将打散后的内容分别放入各自的临 时数组,其中,分内容的内容指单词的词性、释义以及例句等;
S4.3对逐一对打散后的内容按字符串进行去重检查,并添加到 对应的结果字符串数据集中汇总,若结果字符串数据集中某 一打散的 内容的字符串不存在,则添加该字符串,若已存在,则不进行任何处 理;
其中,步骤S4.1中根据HTML标识截取解释结果内容放入临时数 组时要对所述内容进行正则处理,剔除网页格式的代码,只将解释内 容放入所述临时数组;
如图3所示,本实施方式中的网络搜词系统,包括链接模块, 用于建立与多个网站的链接;获取模块,用于获取用户提交的待搜索 单词、查询条件以及网站信息;输入模块,用于将待搜索的单词提交 到用户指定网站,对返回结果进行编码;拆分、汇总模块,根据HTML
标签,截取返回结果中的解释内容,按设定的模式对解释内容进行拆
分,并将拆分后的内容放入对应的字符串数据集中汇总;输出模块, 用于保存一次搜索的所有结果到解释数据集,并输出。
其中,拆分、汇总模块进一步包括截取子模块,对编码后的返 回结果进行字符查找,根据HTML标签截取解释内容放入临时数组; 拆分子模块,将放入临时数组的解释内容按照HTML标签以分内容、 分段、分行的模式进行打散处理,并将打散后的内容放入各自的临时数组;去重、汇总子模块,对打散的内容逐一按字符串进行去重检查, 并添加到对应的结果字符串数据集中。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关 技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下, 还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明 的范畴,本发明的专利保护范围应由权利要求限定。
权利要求
1、一种网络搜词方法,其特征在于,该方法包括步骤S1. 建立与多个网站的链接;S2. 获取用户提交的待搜索单词、查询条件以及网站信息;S3. 将所述单词提交到用户指定的网站,等待返回结果,对所述返回结果进行编码;S4. 根据HTML标签,截取所述返回结果中的解释内容,按设定的模式对所述解释内容进行拆分,并将拆分后的内容放入对应字符串数据集中汇总;S5. 若用户继续指定对所述单词需进行搜索的网站,则返回步骤S3,否则执行步骤S6;S6. 保存本次搜索的所有结果到解释数据集,并输出。
2、 如权利要求l所述的网络搜词方法,其特征在于,步骤S4进一 步包括S4.1对所述编码后的返回结果进行字符查找,根据HTML标签截 取解释内容放入临时数组;S4.2将所述放入临时数组的解释内容按照HTML标签以分内容、 分段、分行的模式进行打散处理,并将打散后的内容放入各自的临时 数组;S4.3对所述打散的内容逐一按字符串进行去重检查,并添加到 对应的字符串数据集中汇总。
3、 如权利要求1所述的网络搜词方法,其特征在于,所述指定 网站为一个或多个。
4、 如权利要求1所述的网络搜词方法,其特征在于,步骤S3中 若无返回结果,则返回步骤S2获取用户重新提交的网站信息,或重 新提交的待搜索单词、查询条件以及网站信息。
5、 如权利要求2所述的网络搜词方法,其特征在于,所述步骤S4.1中根据HTML标识截取解释结果内容放入临时数组时要对所述 内容进行正则处理,剔除网页格式的代码,只将解释内容放入所述临 时数组。
6、 如权利要求2所述的网络搜词方法,其特征在于,所述步骤 S4.2分内容中的内容为单词的词性、释义以及例句。
7、 如权利要求2所述的网络搜词方法,其特征在于,所述步骤 S4.3中,若所述数据集中所述打散的内容的字符串不存在,则添加该 字符串,若已存在,则不进行任何处理。
8、 一种网络搜词系统,其特征在于,该系统包括 链接模块,用于建立与多个网站的链接;获取模块,用于获取用户提交的待搜索单词、查询条件以及网站#一自 i口 ,a、,输入模块,用于将所述单词提交到用户指定网站,对返回结果进行编码;拆分、汇总模块,根据HTML标签,截取所述返回结果中的解 释内容,按设定的模式对所述解释内容进行拆分,并将拆分后的内容 放入对应的字符串数据集中汇总;输出模块,用于保存一次搜索的所有结果到解释数据集,并输出。
9、 如权利要求8所述的网络搜词系统,其特征在于,所述拆分、 汇总模块进一步包括截取子模块,对所述编码后的返回结果进行字符查找,根据 HTML标签截取解释内容放入临时数组;拆分子模块,将所述放入临时数组的解释内容按照HTML标签以 分内容、分段、分行的模式进行打散处理,并将打散后的内容放入各 自的临时数组;去重、汇总子模块,对所述打散的内容逐一按字符串进行去重检 查,并添加到对应的结果字符串数据集中。
全文摘要
本发明涉及一种网络搜词方法及系统,该方法通过将单词提交到指定网站,对返回结果进行编码;根据HTML标签,截取返回结果中的解释内容,按设定的模式对解释内容进行拆分,最后,将拆分后的内容放入对应字符串数据集中汇总并输出。网络搜词系统,该系统包括链接模块,建立与多个网站的链接;获取模块,用于获取用户提交的待搜索单词、查询条件以及网站信息;输入模块,用于将单词提交到指定网站,对返回结果进行编码;拆分、汇总模块,根据HTML标签,截取返回结果中的解释内容,按设定模式对其进行拆分,并将拆分后的内容放入对应的数据集中汇总;全部搜索结果由输出模块输出。本发明的方法及系统大大减少了用户进行网络搜词的时间。
文档编号G06F17/30GK101464906SQ20091007655
公开日2009年6月24日 申请日期2009年1月8日 优先权日2009年1月8日
发明者何战涛 申请人:传神联合(北京)信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1