本发明涉及计算机技术领域,特别涉及一种专利地图建模方法和装置。
背景技术
专利地图由各种与专利相关的资料讯息,以统计分析方法,加以缜密及精细剖析整理制成各种可分析解读的图表讯息,使其具有类似地图指向功能。
专利地图提供了一种文本分析工具,该工具以待分析专利数据为基础,对其中的相关词汇的词频应用聚类分析生成主题地形图,以此来描述专利技术主题分布情况。目前的专利地图主要是基于词频度绘制图形,存在比较片面不够准确的问题。
技术实现要素:
本发明实施例提供的一种专利地图建模方法和装置,用以解决现有技术中专利地图存在的比较片面不够准确的问题。
为了解决上述问题,本发明实施例提供了一种专利地图建模方法,应用于专利数据分析展示,该方法包括:
获取每个专利数据集合中的专利数据;
计算每条专利数据与对应的专利数据集合的标签信息的相关度值;
根据每条专利数据对应的相关度值确定所述专利数据的地图坐标信息;
根据每条专利数据对应的地图坐标信息建立专利地图。
可选的,所述方法之前还包括:
获取每条专利数据的至少一个关键词;
将具有共同关键词的专利数据分类到同一个专利数据集合中。
可选的,所述计算每条专利数据与对应的专利数据集合的标签信息的相关度值,包括:
计算专利数据的至少一个关键词与所述标签信息的至少一个相关度值;
根据所述至少一个相关度值以及对应的所述至少一个关键词的权重计算所述专利数据与对应的专利数据集合的标签信息的相关度值。
可选的,所述根据每条专利数据对应的相关度值确定所述专利数据的地图坐标信息之前还包括:
确定每个专利数据集合在所述地图中的区域;
相应的,所述根据每条专利数据对应的相关度值确定所述专利数据的地图坐标信息,包括:
确定每条专利数据在所属的专利数据集合对应的区域中的地图坐标信息。
可选的,所述方法之后还包括:
根据用户操作指示信息对所述专利地图进行编辑操作。
可选的,所述根据用户操作指示信息对所述专利地图进行编辑操作,包括:
当所述用户操作指示信息为查看信息指令时,执行查看所述专利地图的几何模型中对应所述用户操作指示信息的专利数据信息的操作。
本发明实施例提供一种专利地图建模装置,应用于专利数据分析展示,其特征在于,该装置包括:
获取模块,用于获取每个专利数据集合中的专利数据;
计算模块,用于计算每条专利数据与对应的专利数据集合的标签信息的相关度值;
处理模块,用于根据每条专利数据对应的相关度值确定所述专利数据的地图坐标信息;
建模模块,用于根据每条专利数据对应的地图坐标信息建立专利地图。
可选的,所述装置还包括:
分类模块,用于获取每条专利数据的至少一个关键词,将具有共同关键词的专利数据分类到同一个专利数据集合中。
可选的,所述计算模块具体用于:
计算专利数据的至少一个关键词与所述标签信息的至少一个相关度值;
根据所述至少一个相关度值以及对应的所述至少一个关键词的权重计算所述专利数据与对应的专利数据集合的标签信息的相关度值。
可选的,所述装置还包括:
操作模块,用于根据用户操作指示信息对所述专利地图进行编辑操作。
本发明实施例提供一种专利地图建模方法和装置,获取每个专利数据集合中的专利数据;计算每条专利数据与对应的专利数据集合的标签信息的相关度值;根据每条专利数据对应的相关度值确定所述专利数据的地图坐标信息;根据每条专利数据对应的地图坐标信息建立专利地图。通过计算相关度并基于其制作专利地图,能够解决现有技术中专利地图存在的比较片面不够准确的问题。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明实施例提供的一种专利地图建模方法的流程示意图;
图2为本发明实施例提供的一种专利地图建模装置的结构示意图。
具体实施方式
下面将结合附图及实施例对本发明的技术方案进行更详细的说明。
需要说明的是,如果不冲突,本发明实施例以及实施例中的各个特征可以相互结合,均在本发明的保护范围之内。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
如图1所示,本发明实施例提供的专利地图建模方法,包括下列步骤:
步骤101、获取每个专利数据集合中的专利数据。
步骤102、计算每条专利数据与对应的专利数据集合的标签信息的相关度值。
步骤103、根据每条专利数据对应的相关度值确定所述专利数据的地图坐标信息。
步骤104、根据每条专利数据对应的地图坐标信息建立专利地图。
可选的,步骤101之前还可以进一步包括:
获取每条专利数据的至少一个关键词;将具有共同关键词的专利数据分类到同一个专利数据集合中。
具体的,专利数据集合中的专利数据,可以利用关键词词典确定其关键词列表。
示例性的,可以查看专利信息的摘要内容中有哪些是在关键词词典中的词语,并将这些词语中的至少一个词语作为该专利信息的关键词并置于该专利信息对应的关键词列表中。当然,除了摘要内容,还可以查看题目、权利要求等内容,还可以通篇查看,然后按照出现频率的次数进行排序,确定关键词。在确定了关键词列表后,就可以根据关键词列表对专利数据进行聚类。较佳的,在确定每个类别的样本数据集合时,可以把一批数据分成若干个组,组内数据就是对应类别的样本数据集合。
本发明实施例的具体分组方式可以采用聚类技术,比如计算机领域经典的k均值(k-means)算法;也可以是人工手动分类,例如:首先确定分类树、分类集合,人工逐一阅读专利数据、然后把专利数据放在某个集合中。
由于专利数据对应的关键词有可能有多个,而且确定关键词的字段也可能有多个,这样就需要为不同的关键词和不同的字段设置权重值。
比如专利数据a的关键词是“传输”和“子帧”;专利数据b的关键词是“传输”;专利数据c的关键词是“子帧”。涉及“传输”的领域有很多,比如计算机领域、通信领域,甚至物流领域都有;而涉及“子帧”的领域一般只有通信,显然关键词“子帧”比“传输”的权重值高。
字段包括域、数据域等,字段的具体含义与具体样本数据的类型相关,字段可以包括标题、作者、正文、日期等。
比如专利数据a、b和c的关键词是都是“子帧”;但是专利数据a和b的“子帧”是在标题中出现;专利数据c的“子帧”是在背景技术中出现。两个专利数据的题目中有相同的关键词说明两个专利数据的相关度比较高;而关键词只是在背景技术中出现,则相关度相对比较低。显然题目这个字段比背景技术这个字段的权重值高。
当然,在实施中可以根据关键词列表、词频统计、同义词典等自动设定关键词的第一权重值和每个字段的第二权重值;还可以人工设定关键词的第一权重值和每个字段的第二权重值。
在确定每个类别集合后,就可以为每个类别集合划分在地图中的区域。具体哪些区域给哪个类别集合、具体区域的大小以及高度可以根据需要确定。
可选的,步骤102可以包括:
计算专利数据的至少一个关键词与所述标签信息的至少一个相关度值;
根据所述至少一个相关度值以及对应的所述至少一个关键词的权重计算所述专利数据与对应的专利数据集合的标签信息的相关度值。
可选的,在步骤103之前,该方法还可以包括:
确定每个专利数据集合在所述地图中的区域;
相应的,步骤103具体可以包括:
确定每条专利数据在所属的专利数据集合对应的区域中的地图坐标信息。
可选的,在步骤104之后,所述方法还可以包括:
根据用户操作指示信息对所述专利地图进行编辑操作。
具体包括:
当所述用户操作指示信息为查看信息指令时,执行查看所述专利地图的几何模型中对应所述用户操作指示信息的专利数据信息的操作。
具体的操作可以包括下列操作中的一种或多种:
为地图元素添加事件,例如鼠标经过、单击、双击,用于查看地图的相关信息;以不同的位置、不同的视角观测地图,包括正视图,侧视图、俯视图等;对整幅地图进行放大、缩小、平移等操作;对区域进行放大、缩小、平移、旋转,删除、修改标注文本(主题词)等操作;地图数据的保存、导出、发布等功能。
本发明实施例提供的一种专利地图建模方法,应用于专利数据分析展示,该方法包括:获取每个专利数据集合中的专利数据;计算每条专利数据与对应的专利数据集合的标签信息的相关度值;根据每条专利数据对应的相关度值确定所述专利数据的地图坐标信息;根据每条专利数据对应的地图坐标信息建立专利地图。通过计算相关度并基于其制作专利地图,能够解决现有技术中专利地图存在的比较片面不够准确的问题。
如图2所示,本发明实施例还提供一种专利地图建模装置00,应用于专利数据分析展示,该装置包括:
获取模块10,用于获取每个专利数据集合中的专利数据;
计算模块20,用于计算每条专利数据与对应的专利数据集合的标签信息的相关度值;
处理模块30,用于根据每条专利数据对应的相关度值确定所述专利数据的地图坐标信息;
建模模块40,用于根据每条专利数据对应的地图坐标信息建立专利地图。
可选的,所述装置00还包括:
分类模块50,用于获取每条专利数据的至少一个关键词,将具有共同关键词的专利数据分类到同一个专利数据集合中。
可选的,所述计算模块20具体用于:
计算专利数据的至少一个关键词与所述标签信息的至少一个相关度值;
根据所述至少一个相关度值以及对应的所述至少一个关键词的权重计算所述专利数据与对应的专利数据集合的标签信息的相关度值。
可选的,所述装置00还包括:
操作模块60,用于根据用户操作指示信息对所述专利地图进行编辑操作。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
对于方法类实施例而言,由于其与装置实施例基本相似,所以描述的比较简单,相关之处参见装置实施例的部分说明即可。
本发明实施例提供一种专利地图建模装置,获取每个专利数据集合中的专利数据;计算每条专利数据与对应的专利数据集合的标签信息的相关度值;根据每条专利数据对应的相关度值确定所述专利数据的地图坐标信息;根据每条专利数据对应的地图坐标信息建立专利地图。通过计算相关度并基于其制作专利地图,能够解决现有技术中专利地图存在的比较片面不够准确的问题。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。