一种地理实体推荐方法与流程

文档序号:30842800发布日期:2022-07-23 01:08阅读:来源:国知局

技术特征:
1.一种地理实体推荐方法,其特征在于,包括以下步骤:步骤1、确定研究区内地理实体语义网络构件所需要的评论数据和地理实体列表;步骤2、提取每条评论数据中核心关注词,结合地理实体列表获得第一地理实体语义网络;提取每条评论数据中评论观点,结合地理实体列表获得第二地理实体语义网络;提取每条评论数据中地理实体之间位置语义关系的关键词,结合地理实体列表获得第三地理实体语义网络;提取每条评论数据中反映评论主题的主题词,结合地理实体列表获得第四地理实体语义网络;步骤3、将步骤2中形成的核心关注词、评论观点、位置语义关系的关键词、主题词作为地理实体的推荐关键词,根据用户所选择的推荐关键词,匹配相对应类型的地理实体语义网络,并进行地理实体语义网络的生成,进而通过新生成地理实体语义网络来推送与用户兴趣最相关的地理实体。2.根据权利要求1所述的一种地理实体推荐方法,其特征在于,步骤1中地理实体列表内每个地理实体都具有经纬度坐标值,地理实体列表是通过如下方式获得的:步骤1.1、研究区内每个地理实体具有唯一值的编号和名称,并对每个地理实体进行评论数据的抓取;步骤1.2、所抓取的每条评论数据对应到所属的地理实体,并建立起一一对应关系。3.根据权利要求1所述的一种地理实体推荐方法,其特征在于,步骤2中获得第一地理实体语义网络的方法具体如下:步骤2.1、基于tf—tdf算法,提取出每条评论数据中的关键词,并对所有评论数据提取出的关键词进行词频统计;步骤2.2、建立词频大于预设阈值的关键词在评论数据中的共现关系网络,计算得到共现关系络的核心关键词的强度值;步骤2.3、根据所有评论数据中关键词的词频数量大小和在共现关系网络中核心关键词的强度值,筛选出核心关注词;步骤2.4、以地理实体为地理实体语义网络的网络节点,若某个核心关注词在两个不同地理实体的各自某条评论数据中都出现,则认为这两个地理实体之间存在一条复杂网络连接边;步骤2.5、基于复杂网络理论,通过网络节点和复杂网络连接边之间的关系,构建第一地理实体语义网络;步骤2中获得第二地理实体语义网络的方法具体如下:步骤3.1、基于百度自然语言处理的在线api,提取出每条评论数据中的评论观点,每条评论观点由一个属性词和描述词组合而成;步骤3.2、按照评论观点的属性词和描述词组合特点,进一步提炼和汇总出评论观点列表;步骤3.3、基于复杂网络理论,以地理实体为地理实体语义网络的网络节点,若评论观点列表中某一评论观点在两个不同地理实体的各自某条评论数据中都出现,则认为这两个地理实体之间存在一条复杂网络连接边;
步骤3.4、基于复杂网络理论,通过网络节点和复杂网络连接边之间的关系,构建第二地理实体语义网络;步骤2中获得第三地理实体语义网络的方法具体如下:步骤4.1、提取出每条评论数据中所有地理实体;步骤4.2、构建表示位置语义关系的关键词及相对应的权重值i;其中,权重值i>1;步骤4.3、基于自然语言语义分析技术,提取每条评论数据中所有两两地理实体之间的位置语义连接关系,即:若一条评论数据中两个地理实体之间没有步骤4.2中所述的表示位置语义关系的关键词,则认为这两个地理实体之间存在一条复杂网络连接边,且边的权重为1;若一条评论数据中两个地理实体之间存在步骤4.2中所述的表示位置语义关系的关键词,则认为这两个地理实体之间存在一条复杂网络连接边,且边的权重为步骤4.2中所述的表示位置语义关系的关键词相对应的权重值;其中,若出现多个步骤4.2中所述的表示位置语义关系的关键词,则以最大权重值的关键词来确定网络边连接关系;步骤4.4、基于复杂网络理论,以地理实体为地理实体语义网络的网络节点,再通过步骤4.3中所确定的复杂网络连接边之间的关系,构建第三地理实体语义网络;步骤2中获得第四地理实体语义网络的方法具体如下:步骤5.1、基于百度自然语言处理的在线api,提取出每条评论数据的主题词;步骤5.2、根据主题词汇总出所有评论数据的主题列表;步骤5.3、基于复杂网络理论,以地理实体为地理实体语义网络的网络节点,若主题列表中某一主题在两个不同地理实体的各自某条评论数据中都出现,则认为这两个地理实体之间存在一条复杂网络连接边;步骤5.4、基于复杂网络理论,通过网络节点和复杂网络连接边之间的关系,构建第四地理实体语义网络。4.根据权利要求3所述的一种地理实体推荐方法,其特征在于,生成第一至第四地理实体语义网络后,分别对各个地理实体语义网络计算网络节点各类指标值;基于该所得到的网络节点各类指标值进行地理实体聚类分析,并根据聚类结果对地理实体进行空间可视化展示。5.根据权利要求3所述的一种地理实体推荐方法,其特征在于,步骤2.2中核心关键词的强度值计算步骤具体包括:步骤2.2.1、基于复杂网络理论,针对所有评论数据,以核心关键词为网络节点,若其中两个核心关键词在一条评论中都出现,则认为这两个核心关键词之间存在一条复杂网络连接边,以此建立关键词复杂网络;步骤2.2.2、对步骤2.2.1中所建立的关键词复杂网络,计算网络节点的度中心性、加权邻近中心性、加权度中心性、加权中介中心性和特征向量中心性指标值;步骤2.2.3、基于熵值法,对步骤2.2.2中所得全部指标计算得到网络节点的综合评价值;该综合评价值即为核心关键词的强度值;步骤3.2中提炼和汇总出评论观点列表计算步骤具体包括:步骤3.2.1、将评论观点中相近语义的属性词进行合并;步骤3.2.2、将评论观点中相近语义的描述词进行合并;
步骤3.2.3、基于步骤3.2.1和3.2.2合并处理后的结果,将评论观点中属性词和描述词均相同的评论观点进行去重,进而得到最终的评论观点列表。6.根据权利要求3所述的一种地理实体推荐方法,其特征在于,步骤4.1中提取出每条评论数据中所有地理实体包括评论数据所属地理实体,无论该条评论数据中是否包括这条评论数据所属地理实体。7.根据权利要求3所述的一种地理实体推荐方法,其特征在于,更新第m地理实体语义网络的方法:根据新评论数据分别进行重建第一至第四地理实体语义网络或者只对新评论数据构建第m地理实体语义网络;其中,新构建的第m地理实体语义网络的网络节点指标结果与原第m地理实体语义网络的网络节点指标结果进行叠加计算,以更新第m地理实体语义网络的网络节点指标结果;m=1,2,3,4。8.根据权利要求1所述的一种地理实体语义网络的地理实体推荐方法,其特征在于,将步骤2所形成的核心关注词、评论观点、位置语义关系的关键词、主题词作为地理实体的推荐关键词;构建一个地理实体推荐系统,该系统提供交互式界面并在系统界面上提供推荐关键词的点击和查询功能,当用户点击或查询到某个推荐关键词后,系统自动展示出与该推荐关键词最相关的地理实体列表,并在地理空间上进行可视化展示。9.根据权利要求8所述的一种地理实体语义网络的地理实体推荐方法,其特征在于,地理实体推荐系统的实现方法如下:步骤a.1、当用户点击或查询到某个推荐关键词时,地理实体推荐系统根据该推荐关键词判断属于第一至第四地理实体语义网络中哪一类;步骤a.2、根据步骤a.1中所确定的地理实体语义网络的类型,只将用户点击或查询到某个推荐关键词作为步骤a.1中所确定的某一类的地理实体语义网络中复杂网络连接边确定的判断条件;步骤a.3、按照步骤a.1中所确定的某一类的地理实体语义网络的生成步骤要求,生成相对应的地理实体语义网络;步骤a.4、对步骤a.3中所生成地理实体语义网络进行网络节点各类指标值的计算,根据网络节点任一类指标值大小顺序,实现地理实体进行筛选,并完成地理实体的空间可视化展示。

技术总结
本发明公开了一种地理实体推荐方法,涉及城市交通技术领域,首先,确定研究区内地理实体语义网络模型构件所需要的评论数据源和地理实体列表。其次,对评论数据开展共现关系、评论观点、位置语义、评论主题等方面分析,计算获得不同类型的地理实体语义网络。再利用复杂网络技术计算各类地理实体语义网络的节点指标值,实现地理实体的聚类和评价推荐分析。最后,根据常用推荐关键词的使用情况,预生成相对应的地理实体语义网络,从而加速相关地理实体语义网络的评价和推荐速度,提升了地理实体语义网络构建的科学性和实用性,具有较强的基于文本语言分析的地理实体推荐能力。本语言分析的地理实体推荐能力。本语言分析的地理实体推荐能力。


技术研发人员:姚秀利 韦胜
受保护的技术使用者:江苏省城市规划设计研究院有限公司
技术研发日:2022.05.05
技术公布日:2022/7/22
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1