一种政府网站搜索方法、系统、设备及介质与流程

文档序号:27681054发布日期:2021-11-30 23:40阅读:145来源:国知局
一种政府网站搜索方法、系统、设备及介质与流程

1.本发明涉及计算机技术领域,特别指一种政府网站搜索方法、系统、设备及介质。


背景技术:

2.随着互联网技术的快速发展,越来越多的服务由线下搬到了线上,通过线上的网站进行相关信息、数据的搜索,已经成为当前获取信息、数据的主流渠道。然而,由于汉字的博大精深,同音词汇繁多,导致使用拼音进行搜索时,搜索结果往往不尽如人意,例如搜索baoxian(保险),展示的搜索结果是保鲜,搜索yisheng(医生),展示的搜索结果是一生。
3.因此,如何提供一种政府网站搜索方法、系统、设备及介质,实现提升网站搜索匹配的精度,成为一个亟待解决的问题。


技术实现要素:

4.本发明要解决的技术问题,在于提供一种政府网站搜索方法、系统、设备及介质,实现提升网站搜索匹配的精度。
5.第一方面,本发明提供了一种政府网站搜索方法,包括如下步骤:
6.步骤s10、创建一网站资源库,将网站资源信息通过数据交换技术同步到所述网站资源库;
7.步骤s20、创建一包括若干个搜索关键字的中文名称、拼音简称、拼音全称、词性以及词权重的词库对照表;
8.步骤s30、获取输入的搜索关键字,基于所述词库对照表匹配对应的网站资源信息进行展示,并更新所述词库对照表。
9.进一步地,所述步骤s10中,所述网站资源库为elasticsearch全文检索数据库;所述网站资源信息至少包括文章标题、文章内容、文章发布时间以及文章url地址。
10.进一步地,所述步骤s20中,所述词权重的初始值为0。
11.进一步地,所述步骤s30具体包括:
12.步骤s31、通过搜索框获取用户输入的搜索关键字;
13.步骤s32、判断所述搜索关键字为中文还是拼音,若为中文,则进入步骤s33;若为拼音,则进入步骤s34;
14.步骤s33、基于所述搜索关键字匹配对应的网站资源信息进行展示;
15.步骤s34、基于所述词库对照表的拼音简称或者拼音查找对应的中文名称,基于所述词权重对各中文名称进行排序,将排序第一的所述中文名称匹配对应的网站资源信息进行展示,其余的所述中文名称作为备选词汇同步展示,基于用户点击所述备选词汇进而对网站资源库进行搜索的次数,对相应的词权重累加更新。
16.第二方面,本发明提供了一种政府网站搜索系统,包括如下模块:
17.网站资源库创建模块,用于创建一网站资源库,将网站资源信息通过数据交换技术同步到所述网站资源库;
18.词库对照表创建关联模块,用于创建一包括若干个搜索关键字的中文名称、拼音简称、拼音全称、词性以及词权重的词库对照表;
19.搜索匹配模块,用于获取输入的搜索关键字,基于所述词库对照表匹配对应的网站资源信息进行展示,并更新所述词库对照表。
20.进一步地,所述网站资源库创建模块中,所述网站资源库为elasticsearch全文检索数据库;所述网站资源信息至少包括文章标题、文章内容、文章发布时间以及文章url地址。
21.进一步地,所述词库对照表创建关联模块中,所述词权重的初始值为0。
22.进一步地,所述搜索匹配模块具体包括:
23.搜索关键字获取单元,用于通过搜索框获取用户输入的搜索关键字;
24.搜索关键字判断单元,用于判断所述搜索关键字为中文还是拼音,若为中文,则进入中文匹配单元;若为拼音,则进入拼音匹配单元;
25.中文匹配单元,用于基于所述搜索关键字匹配对应的网站资源信息进行展示;
26.拼音匹配单元,用于基于所述词库对照表的拼音简称或者拼音查找对应的中文名称,基于所述词权重对各中文名称进行排序,将排序第一的所述中文名称匹配对应的网站资源信息进行展示,其余的所述中文名称作为备选词汇同步展示,基于用户点击所述备选词汇进而对网站资源库进行搜索的次数,对相应的词权重累加更新。
27.第三方面,本发明提供了一种政府网站搜索设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。
28.第四方面,本发明提供了一种政府网站搜索介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的方法。
29.本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
30.通过创建包括若干个搜索关键字的中文名称、拼音简称、拼音全称、词性以及词权重的词库对照表,当用户通过搜索关键字在网站上进行搜索时,若搜索关键字为中文,由于中文不存在歧义,则基于搜索关键字匹配对应的网站资源信息;若搜索关键字为拼音,由于存在多音字,使得拼音存在歧义,因此基于词库对照表的拼音简称或者拼音全称匹配对应的中文名称,并基于词权重对各中文名称进行排序,将排序第一的所述中文名称匹配对应的网站资源信息进行展示,其余的所述中文名称作为备选词汇同步展示,而词权重基于网站资源信息被点击的次数进行更新,即实现用户搜索一个拼音时优先展示被点击次数最多的网站资源信息,最终极大的提升了网站搜索匹配的精度。
31.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
32.下面参照附图结合实施例对本发明作进一步的说明。
33.图1是本发明一种政府网站搜索方法的流程图。
34.图2是本发明一种政府网站搜索系统的结构示意图。
35.图3是本发明一种政府网站搜索设备的结构示意图。
36.图4是本发明一种政府网站搜索介质的结构示意图。
具体实施方式
37.本技术实施例通过提供一种政府网站搜索方法、系统、设备及介质,实现提升网站搜索匹配的精度。
38.本技术实施例中的技术方案,总体思路如下:基于网站资源信息被点击的次数设置搜索关键字的词权重,当用户使用拼音进行搜索时,通过词权重对拼音对应的中文名称进行排序,将排序第一的所述中文名称匹配对应的网站资源信息进行展示,即基于用户搜索的大数据匹配拼音最有可能对应的网站资源信息,克服因同音词汇繁多而导致的搜索结果不达预期,以提升网站搜索匹配的精度。
39.实施例一
40.本实施例提供一种政府网站搜索方法,如图1所示,包括如下步骤:
41.步骤s10、创建一网站资源库,将网站资源信息通过数据交换技术同步到所述网站资源库;
42.步骤s20、创建一包括若干个搜索关键字的中文名称、拼音简称、拼音全称、词性以及词权重的词库对照表;所述中文名称、拼音简称、拼音全称、词性以及词权重一一对应;
43.步骤s30、获取输入的搜索关键字,基于所述词库对照表匹配对应的网站资源信息进行展示,并更新所述词库对照表。
44.由于不同网站用于提供不同的服务,例如美食网站里多是食品相关名词,政府网站里多是政务相关名词,因此在特定的网站里,一个拼音对应的中文名称基本也是固定的,通过用户点击次数即可判断在特定情境下的意思。通过所述搜索方法,基于词权重对搜索关键字进行排序,用户可按需点击需要的、关心的所述网站资源信息,并通过用户搜索的大数据实时更新所述词权重,让搜索能越来越贴近用户所想,能快速找到所需的所述网站资源信息,不必重新利用中文名称进行搜索,极大的提升了搜索效率。
45.所述步骤s10中,所述网站资源库为elasticsearch全文检索数据库;所述网站资源信息至少包括文章标题、文章内容、文章发布时间以及文章url地址。所述文章标题、文章内容、文章发布时间以及文章url地址一一对应。
46.所述步骤s20中,所述词权重的初始值为0。
47.所述步骤s30具体包括:
48.步骤s31、通过搜索框获取用户输入的搜索关键字;
49.步骤s32、判断所述搜索关键字为中文还是拼音,若为中文,则进入步骤s33;若为拼音,则进入步骤s34;
50.步骤s33、基于所述搜索关键字匹配对应的网站资源信息进行展示;由于中文不存在歧义,因此基于所述搜索关键字直接进行匹配;
51.步骤s34、基于所述词库对照表的拼音简称或者拼音查找对应的中文名称,基于所述词权重对各中文名称进行排序,将排序第一的所述中文名称匹配对应的网站资源信息进行展示,其余的所述中文名称作为备选词汇同步展示,基于用户点击所述备选词汇进而对网站资源库进行搜索的次数,对相应的词权重累加更新,即每点击1次所述词权重加1。
52.由于拼音可能对应多个所述中文名称,因此通过所述词权重对中文名称进行排序,进而优先展示最有可能符合用户意思的所述网站资源信息,即通过用户搜索的大数据可调整所述网站资源信息的排序。例如用户搜索“baoxian”,而“baoxian”对应的中文名称有“保险”和“保鲜”,“保险”的词权重为100,“保鲜”的词权重为2,因此优先展示“保险”对应的网站资源信息。
53.实施例二
54.本实施例提供一种政府网站搜索系统,如图2所示,包括如下模块:
55.网站资源库创建模块,用于创建一网站资源库,将网站资源信息通过数据交换技术同步到所述网站资源库;
56.词库对照表创建关联模块,用于创建一包括若干个搜索关键字的中文名称、拼音简称、拼音全称、词性以及词权重的词库对照表;所述中文名称、拼音简称、拼音全称、词性以及词权重一一对应;
57.搜索匹配模块,用于获取输入的搜索关键字,基于所述词库对照表匹配对应的网站资源信息进行展示,并更新所述词库对照表。
58.由于不同网站用于提供不同的服务,例如美食网站里多是食品相关名词,政府网站里多是政务相关名词,因此在特定的网站里,一个拼音对应的中文名称基本也是固定的,通过用户点击次数即可判断在特定情境下的意思。通过所述搜索方法,基于词权重对搜索关键字进行排序,用户可按需点击需要的、关心的所述网站资源信息,并通过用户搜索的大数据实时更新所述词权重,让搜索能越来越贴近用户所想,能快速找到所需的所述网站资源信息,不必重新利用中文名称进行搜索,极大的提升了搜索效率。
59.所述网站资源库创建模块中,所述网站资源库为elasticsearch全文检索数据库;所述网站资源信息至少包括文章标题、文章内容、文章发布时间以及文章url地址。所述文章标题、文章内容、文章发布时间以及文章url地址一一对应。
60.所述词库对照表创建关联模块中,所述词权重的初始值为0。
61.所述搜索匹配模块具体包括:
62.搜索关键字获取单元,用于通过搜索框获取用户输入的搜索关键字;
63.搜索关键字判断单元,用于判断所述搜索关键字为中文还是拼音,若为中文,则进入中文匹配单元;若为拼音,则进入拼音匹配单元;
64.中文匹配单元,用于基于所述搜索关键字匹配对应的网站资源信息进行展示;由于中文不存在歧义,因此基于所述搜索关键字直接进行匹配;
65.拼音匹配单元,用于基于所述词库对照表的拼音简称或者拼音查找对应的中文名称,基于所述词权重对各中文名称进行排序,将排序第一的所述中文名称匹配对应的网站资源信息进行展示,其余的所述中文名称作为备选词汇同步展示,基于用户点击所述备选词汇进而对网站资源库进行搜索的次数,对相应的词权重累加更新,即每点击1次所述词权重加1。
66.由于拼音可能对应多个所述中文名称,因此通过所述词权重对中文名称进行排序,进而优先展示最有可能符合用户意思的所述网站资源信息,即通过用户搜索的大数据可调整所述网站资源信息的排序。例如用户搜索“baoxian”,而“baoxian”对应的中文名称有“保险”和“保鲜”,“保险”的词权重为100,“保鲜”的词权重为2,因此优先展示“保险”对应
的网站资源信息。
67.基于同一发明构思,本技术提供了实施例一对应的电子设备实施例,详见实施例三。
68.实施例三
69.本实施例提供了一种政府网站搜索设备,如图3所示,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,可以实现实施例一中任一实施方式。
70.由于本实施例所介绍的电子设备为实施本技术实施例一中方法所采用的设备,故而基于本技术实施例一中所介绍的方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本技术实施例中的方法不再详细介绍。只要本领域所属技术人员实施本技术实施例中的方法所采用的设备,都属于本技术所欲保护的范围。
71.基于同一发明构思,本技术提供了实施例一对应的存储介质,详见实施例四。
72.实施例四
73.本实施例提供一种政府网站搜索介质,如图4所示,其上存储有计算机程序,该计算机程序被处理器执行时,可以实现实施例一中任一实施方式。
74.本技术实施例中提供的技术方案,至少具有如下技术效果或优点:
75.通过创建包括若干个搜索关键字的中文名称、拼音简称、拼音全称、词性以及词权重的词库对照表,当用户通过搜索关键字在网站上进行搜索时,若搜索关键字为中文,由于中文不存在歧义,则基于搜索关键字匹配对应的网站资源信息;若搜索关键字为拼音,由于存在多音字,使得拼音存在歧义,因此基于词库对照表的拼音简称或者拼音全称匹配对应的中文名称,并基于词权重对各中文名称进行排序,将排序第一的所述中文名称匹配对应的网站资源信息进行展示,其余的所述中文名称作为备选词汇同步展示,而词权重基于网站资源信息被点击的次数进行更新,即实现用户搜索一个拼音时优先展示被点击次数最多的网站资源信息,最终极大的提升了网站搜索匹配的精度。
76.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
77.本发明是参照本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
78.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或
多个方框中指定的功能。
79.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
80.虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1