一种双检索的专利数据库建立方法和装置与流程

文档序号:21266277发布日期:2020-06-26 22:42阅读:254来源:国知局
一种双检索的专利数据库建立方法和装置与流程

本发明涉及数据处理技术领域,尤其涉及一种双检索的专利数据库建立方法和装置。



背景技术:

专利文献检索即搜索专利及专利文献。中国专利检索系统(cprs):是一种仅在国家知识产权局局域网中使用的专利检索与全文浏览系统。该系统包含:1985年以来三种中国专利著录数据及发明、实用新型全文说明书;1975年以来美国专利著录数据及全文说明书;1993年以来日本专利和实用新型各种全文说明书。专利文献检索是企业全面了解现有技术,提高研发起点,规避知识产权风险的基础工作。由于网上公开的原始专利数据信息不全、语言晦涩、冗长难懂,企业如果不掌握专业的检索方法和技能,检索存在困难。而随着社会制度的不断发展与完善,专利文献数量的迅速增加,使得各国企业对于专利权的保护越来越重视。对于企业而言,如何从大量的专利文献中精确地检索并分析出满足自身需求的信息,对整个企业的发展至关重要。随着检索需要的不同,检索要求的多样化,不光需要进行单一专利文献的检索处理,有时还需要对两篇专利文献进行共同检索。

但本发明申请人发现现有技术至少存在如下技术问题:

现有技术中面对双专利检索需要的处理为人工操作,存在过程繁琐,耗时耗力,且检索数据库完整性、有效性不高的技术问题。



技术实现要素:

本发明实施例提供了一种双检索的专利数据库建立方法和装置,解决了现有技术中面对双专利检索需要的处理为人工操作,存在过程繁琐,耗时耗力,且检索数据库完整性、有效性不高的技术问题。

鉴于上述问题,提出了本申请实施例以便提供一种双检索的专利数据库建立方法和装置。

第一方面,本发明提供了一种双检索的专利数据库建立方法,所述方法包括:获得第一专利文献,其中,所述第一专利文献具有第一关键词;根据所述第一关键词从所述专利检索数据平台中获得第一专利数据库;获得第二专利文献,所述第一专利文献和所述第二专利文献均为目标专利文献;判断所述第二专利文献是否存在于所述第一专利数据库中;当所述第二专利文献存在于所述第一专利数据库中,根据所述第二专利文献获得第二关键词;根据所述第二关键词从所述专利检索数据平台中获得第二专利数据库;根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。

优选的,所述根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库,包括:判断所述第一关键词和所述第二关键词是否为同一类型的词;当所述第一关键词和所述第二关键词是同一类型的词时,根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。

优选的,所述判断所述第一关键词和所述第二关键词是否为同一类型的词之后,包括:当所述第一关键词和所述第二关键词不为同一类型的词时,获得所述第一专利数据库和所述第二专利数据库中相同的专利的数量;判断所述第一专利数据库与所述第二专利数据库中相同的专利数量是否满足预定条件;当所述数量满足所述预定条件时,根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。

优选的,所述当所述数量满足预定条件时,包括:所述数量达到所述第一专利数据库的50%以上,和/或所述数量达到所述第二专利数据库的50%以上。

优选的,所述同一类型指的是在所述专利数据检索平台中,基于所述第一专利文献和第二专利文献,能相互替代关键词。

第二方面,本发明提供了一种双检索的专利数据库建立装置,所述装置包括:

第一获得单元,所述第一获得单元用于获得第一专利文献,其中,所述第一专利文献具有第一关键词;

第二获得单元,所述第二获得单元用于根据所述第一关键词从所述专利检索数据平台中获得第一专利数据库;

第三获得单元,所述第三获得单元用于获得第二专利文献,所述第一专利文献和所述第二专利文献均为目标专利文献;

第一判断单元,所述第一判断单元用于判断所述第二专利文献是否存在于所述第一专利数据库中;

第四获得单元,所述第四获得单元用于当所述第二专利文献存在于所述第一专利数据库中,根据所述第二专利文献获得第二关键词;

第五获得单元,所述第五获得单元用于根据所述第二关键词从所述专利检索数据平台中获得第二专利数据库;

第六获得单元,所述第六获得单元用于根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。

优选的,所述装置还包括:

第二判断单元,所述第二判断单元用于判断所述第一关键词和所述第二关键词是否为同一类型的词;

第七获得单元,所述第七获得单元用于当所述第一关键词和所述第二关键词是同一类型的词时,根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。

优选的,所述装置还包括:

第八获得单元,所述第八获得单元用于当所述第一关键词和所述第二关键词不为同一类型的词时,获得所述第一专利数据库和所述第二专利数据库中相同的专利的数量;

第三判断单元,所述第三判断单元用于判断所述第一专利数据库与所述第二专利数据库中相同的专利数量是否满足预定条件;

第九获得单元,所述第九获得单元用于当所述数量满足所述预定条件时,根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。

优选的,所述数量达到所述第一专利数据库的50%以上,和/或所述数量达到所述第二专利数据库的50%以上。

优选的,所述同一类型指的是在所述专利数据检索平台中,基于所述第一专利文献和第二专利文献,能相互替代关键词。

第三方面,本发明提供了一种双检索的专利数据库建立装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述方法的步骤。

第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。

本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:

本发明实施例提供的一种双检索的专利数据库建立方法和装置,通过获得第一专利文献,其中,所述第一专利文献具有第一关键词;根据所述第一关键词从所述专利检索数据平台中获得第一专利数据库;获得第二专利文献,所述第一专利文献和所述第二专利文献均为目标专利文献;判断所述第二专利文献是否存在于所述第一专利数据库中;当所述第二专利文献存在于所述第一专利数据库中,根据所述第二专利文献获得第二关键词;根据所述第二关键词从所述专利检索数据平台中获得第二专利数据库;根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。达到了分别对双专利按照检索需要进行处理,实现双检索结果数据库的自动建立,保证检索结果全面性,提高检索效率的技术效果。从而解决了现有技术中面对双专利检索需要的处理为人工操作,存在过程繁琐,耗时耗力,且检索数据库完整性、有效性不高的技术问题。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

图1为本发明实施例中一种双检索的专利数据库建立方法的流程示意图;

图2为本发明实施例中一种双检索的专利数据库建立装置的结构示意图;

图3为本发明实施例中另一种双检索的专利数据库建立装置的结构示意图。

附图标记说明:第一获得单元11,第二获得单元12,第三获得单元13,第一判断单元14,第四获得单元15,第五获得单元16,第六获得单元17,总线300,接收器301,处理器302,发送器303,存储器304,总线接口306。

具体实施方式

本发明实施例提供了一种双检索的专利数据库建立方法和装置,用于解决现有技术中面对双专利检索需要的处理为人工操作,存在过程繁琐,耗时耗力,且检索数据库完整性、有效性不高的技术问题。

本发明提供的技术方案总体思路如下:

获得第一专利文献,其中,所述第一专利文献具有第一关键词;根据所述第一关键词从所述专利检索数据平台中获得第一专利数据库;获得第二专利文献,所述第一专利文献和所述第二专利文献均为目标专利文献;判断所述第二专利文献是否存在于所述第一专利数据库中;当所述第二专利文献存在于所述第一专利数据库中,根据所述第二专利文献获得第二关键词;根据所述第二关键词从所述专利检索数据平台中获得第二专利数据库;根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。达到了分别对双专利按照检索需要进行处理,实现双检索结果数据库的自动建立,保证检索结果全面性,提高检索效率的技术效果。

下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。

本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

实施例一

图1为本发明实施例中一种双检索的专利数据库建立方法的流程示意图。如图1所示,本发明实施例提供了一种双检索的专利数据库建立方法,所述方法包括:

步骤110:获得第一专利文献,其中,所述第一专利文献具有第一关键词。

具体而言,第一专利文献为目标专利文献,即需要进行检索的专利文献,通过对第一专利文献的内容、标题、分类号的分析,确定其关键词,关键字就是用户在使用搜索引擎时,输入的能够最大程度概括用户所要查找的信息内容。在搜索引擎优化seo行业谈到的关键字,往往是指网页的核心和主要内容。对于搜索引擎来说,你的网页主要是讲关于哪方面的内容,那个方面就可以归结出一个(更多时候会是多个)关键字。对于专利文献来说,关键词为该专利文献描述主题的核心描述内容,能够对专利文献的主体和重要发明内容进行定位的词语。

步骤120:根据所述第一关键词从所述专利检索数据平台中获得第一专利数据库。

具体而言,经过对第一专利文献其关键词的确定后,利用关键词进行专利文献数据库的检索,主要利用现有的成熟专利检索数据平台进行检索,如企查查、专利局网页等等,通过对专利检索数据平台的链接,将确定的关键词进行录入,获得对应的关键词专利文献数据库,该专利文献数据集合为第一专利数据库。

步骤130:获得第二专利文献,所述第一专利文献和所述第二专利文献均为目标专利文献。

具体而言,第二专利文献与第一专利文献一样,也是目标专利文献,即需要进行检索的专利文献,也就是说本实施例具有双检索要求,需要对第一专利文献、第二专利文献均进行检索处理,满足两个专利文献的相关检索要求。

步骤140:判断所述第二专利文献是否存在于所述第一专利数据库中。

具体而言,经过对第一专利文献的检索处理后得到的第一专利数据库,第一专利数据库为通过第一专利文献的第一关键词从专利数据平台中检索获得的所有符合第一关键词要求的,即与第一关键词相关的所有专利文献集合。判断第二专利文献是否在第一专利数据库内,即判断第二专利文献与第一专利文献是否具有一定的相关性。判断第二专利文献是否存在于第一专利数据库中可以利用第二专利文献的标题和\或专利权利人信息进行检索,从而确定第二专利文献是否存在于第一专利文献中。

步骤150:当所述第二专利文献存在于所述第一专利数据库中,根据所述第二专利文献获得第二关键词。

具体而言,当第二专利文献存在于第一专利数据库中,则说明第二专利文献与第一专利文献存在关联性,最少第二专利文献中具有与第一专利文献相同的第一关键词。此时根据第二专利文献的内容、标题、分类号信息等确定第二专利文献的第二关键词,第二关键词为第二专利文献的核心词,能够对第二专利文献的核心内容进行表述的词语,第二关键词与第一关键词可能相同、也可能不相同。若第二关键词与第一关键词相同,则确定第一专利数据库为最终的专利检索结果,若不相同则需要进一步对第二关键词进行检索处理。另外,有些专利可能存在多个关键词的情况,可以对关键词进行进一步分析,从中确定更符合第二专利文献的发明内容的关键词作为第二关键词,也可以将多个关键词分别进行检索处理。当然若有多个关键词,其中存在与第一关键词相同的情况,可以去除该关键词,利用除相同关键词之外的另一关键词进行检索。

步骤160:根据所述第二关键词从所述专利检索数据平台中获得第二专利数据库。

具体而言,利用第二专利文献的关键词即第二关键词再次利用专利检索数据平台进行数据检索,获得第二专利数据库,因而第二专利数据库为现有公开的专利文献中包含了第二关键词的所有专利文献集合。

步骤170:根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。

具体而言,通过对第一专利文献的分析检索和第二专利文献的分析检索,得到第一专利数据库和第二专利数据库,为了满足两个专利文献的双检索要求,将两个数据库进行合并,即利用第一专利数据库、第二专利数据库进行合并,得到其组合集合为第三专利数据库,所述第三专利数据库中包括了第一专利文献、第二专利文献的所有检索结果,当然可能存在有重复专利的情况,将重复专利进行合并,达到了分别对双专利按照检索需要进行处理,实现双检索结果数据库的自动建立,保证检索结果全面性,提高检索效率的技术效果。从而解决了现有技术中面对双检索需要处理为人工操作,过程繁琐,耗时耗力,且存在检索数据库不完整的技术问题。

进一步的,所述根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库,包括:判断所述第一关键词和所述第二关键词是否为同一类型的词;当所述第一关键词和所述第二关键词是同一类型的词时,根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。

进一步的,所述同一类型指的是在所述专利数据检索平台中,基于所述第一专利文献和第二专利文献,能相互替代关键词。

具体而言,在将第一专利数据库与第二专利数据库进行合并操作时,首先判断第一关键词和第二关键词是否为同一类型的词,可以从第一关键词的属性、词意和所用的语境等多方面进行同一类判断,如利用给参数的占比进行评分,通过加权计算得到相似度数值,再根据设定的相似度阈值进行比较,若满足要求则认定第一关键词与第二关键词为同一类型词语。属于同一类型词语即第一关键词与第二关键词为可以相互替代的关键词时,则认为第一关键词与第二关键词为同类的词,当第一关键词与第二关键词满足同一类型词语的要求时,则将第一专利数据库与第二专利数据库进行合并处理,将第一专利数据库和第二专利数据库进行组合并将重复的删除,获得最终确定的检索数据库。实现了双专利检索结果的有效处理,确保检索数据库的完整性和有效性。

进一步的,所述判断所述第一关键词和所述第二关键词是否为同一类型的词之后,包括:当所述第一关键词和所述第二关键词不为同一类型的词时,获得所述第一专利数据库和所述第二专利数据库中相同的专利的数量;判断所述第一专利数据库与所述第二专利数据库中相同的专利数量是否满足预定条件;当所述数量满足所述预定条件时,根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。

进一步的,所述当所述数量满足预定条件时,包括:所述数量达到所述第一专利数据库的50%以上,和/或所述数量达到所述第二专利数据库的50%以上。

具体而言,若经过判断第一关键词和第二关键词不属于同一类型词时,即第一关键词与第二关键词不能进行替代,则对第一专利数据库和第二专利数据库内的专利进行进一步分析,根据第一专利数据库与第二专利数据库内相同专利的数量为标准进行判断,当第一专利数据库与第二专利数据库中重复的专利数量较多,则也可以说明两个专利的内容关联性较大,满足数量要求时,将第一专利数据库与第二专利数据库进行组合获得最终确定的检索结果,即第三专利数据库。若第一专利数据库与第二专利数据库内重复专利的数量不多或者没有时,则表明第一专利数据库和第二专利数据库的关联性较低或者无关联,对应的第一专利文献与第二专利文献之间的关联性也就较低或者无关联性,此时两个专利数据库则不能进行合并,没有检索参考的价值。在进行专利数据库数量相似度判断时,通常专利的重复数量应至少为第一专利数据库或\和第二专利数据库的50%,当然根据检索数据结果的参考要求,也可以根据需要进行调整,以保证检索数据库的有效性。

实施例二

基于与前述实施例中一种双检索的专利数据库建立方法同样的发明构思,本发明还提供一种双检索的专利数据库建立方法装置,如图2所示,所述装置包括:

第一获得单元11,所述第一获得单元11用于获得第一专利文献,其中,所述第一专利文献具有第一关键词;

第二获得单元12,所述第二获得单元12用于根据所述第一关键词从所述专利检索数据平台中获得第一专利数据库;

第三获得单元13,所述第三获得单元13用于获得第二专利文献,所述第一专利文献和所述第二专利文献均为目标专利文献;

第一判断单元14,所述第一判断单元14用于判断所述第二专利文献是否存在于所述第一专利数据库中;

第四获得单元15,所述第四获得单元15用于当所述第二专利文献存在于所述第一专利数据库中,根据所述第二专利文献获得第二关键词;

第五获得单元16,所述第五获得单元16用于根据所述第二关键词从所述专利检索数据平台中获得第二专利数据库;

第六获得单元17,所述第六获得单元17用于根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。

进一步的,所述装置还包括:

第二判断单元,所述第二判断单元用于判断所述第一关键词和所述第二关键词是否为同一类型的词;

第七获得单元,所述第七获得单元用于当所述第一关键词和所述第二关键词是同一类型的词时,根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。

进一步的,所述装置还包括:

第八获得单元,所述第八获得单元用于当所述第一关键词和所述第二关键词不为同一类型的词时,获得所述第一专利数据库和所述第二专利数据库中相同的专利的数量;

第三判断单元,所述第三判断单元用于判断所述第一专利数据库与所述第二专利数据库中相同的专利数量是否满足预定条件;

第九获得单元,所述第九获得单元用于当所述数量满足所述预定条件时,根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。

进一步的,所述数量达到所述第一专利数据库的50%以上,和/或所述数量达到所述第二专利数据库的50%以上。

进一步的,所述同一类型指的是在所述专利数据检索平台中,基于所述第一专利文献和第二专利文献,能相互替代关键词。

前述图1实施例一中的一种双检索的专利数据库建立方法的各种变化方式和具体实例同样适用于本实施例的一种双检索的专利数据库建立装置,通过前述对一种双检索的专利数据库建立方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种双检索的专利数据库建立装置的实施方法,所以为了说明书的简洁,在此不再详述。

实施例三

基于与前述实施例中一种双检索的专利数据库建立方法同样的发明构思,本发明还提供一种双检索的专利数据库建立装置,如图3所示,包括存储器304、处理器302及存储在存储器304上并可在处理器302上运行的计算机程序,所述处理器302执行所述程序时实现前文所述一种双检索的专利数据库建立方法的任一方法的步骤。

其中,在图3中,总线架构(用总线300来代表),总线300可以包括任意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口306在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器302负责管理总线300和通常的处理,而存储器304可以被用于存储处理器302在执行操作时所使用的数据。

实施例四

基于与前述实施例中一种双检索的专利数据库建立方法同样的发明构思,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:获得第一专利文献,其中,所述第一专利文献具有第一关键词;根据所述第一关键词从所述专利检索数据平台中获得第一专利数据库;获得第二专利文献,所述第一专利文献和所述第二专利文献均为目标专利文献;判断所述第二专利文献是否存在于所述第一专利数据库中;当所述第二专利文献存在于所述第一专利数据库中,根据所述第二专利文献获得第二关键词;根据所述第二关键词从所述专利检索数据平台中获得第二专利数据库;根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。

在具体实施过程中,该程序被处理器执行时,还可以实现实施例一中的任一方法步骤。

本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:

本发明实施例提供的一种双检索的专利数据库建立方法和装置,通过获得第一专利文献,其中,所述第一专利文献具有第一关键词;根据所述第一关键词从所述专利检索数据平台中获得第一专利数据库;获得第二专利文献,所述第一专利文献和所述第二专利文献均为目标专利文献;判断所述第二专利文献是否存在于所述第一专利数据库中;当所述第二专利文献存在于所述第一专利数据库中,根据所述第二专利文献获得第二关键词;根据所述第二关键词从所述专利检索数据平台中获得第二专利数据库;根据所述第一专利数据库和所述第二专利数据库获得第三专利数据库。达到了分别对双专利按照检索需要进行处理,实现双检索结果数据库的自动建立,保证检索结果全面性,提高检索效率的技术效果。从而解决了现有技术中面对双专利检索需要的处理为人工操作,存在过程繁琐,耗时耗力,且检索数据库完整性、有效性不高的技术问题。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1