本发明属于智能匹配领域,特别涉及一种数据智能匹配方法及系统。
背景技术:
1、智能匹配技术普遍应用于同类数据或不同类数据之间的相似度匹配,通过对数据的分析和检索实现。在科技成果转化方面,智能匹配技术是为科技成果和需求方之间提供的一种交互服务,通过为科技成果方匹配相应的需求方,以实现科技技术的共同发展及进步,但是目前科技成果方和需求方之间进行匹配时,均是通过直接搜索的模式进行寻找的,这种匹配搜索的方式导致出现的科技成果方或需求方过多,因对于需求方来说,当确定一个最为匹配的资源方即可,并无需大量的资源方,进而,上述进行大范围的搜索匹配不仅降低了搜索匹配效率,也达不到良好的匹配对接效果。
技术实现思路
1、针对上述问题,本发明采用的技术方案是:一种数据智能匹配方法及系统,所述匹配方法包括以下步骤:
2、根据业务数据的内容确定所述业务数据的结构化特征及非结构化特征;
3、将所述结构化特征和所述非结构化特征与对应的所述业务数据进行关联并存入数据库;
4、以所述结构化特征和所述非结构化特征作为输入,建立用于计算匹配相关性的计算公式;
5、基于所述计算公式计算待匹配业务数据与所述数据库内各所述业务数据的相关性,并根据所述相关性输出匹配结果。
6、可选地,所述结构化特征包括所述业务数据的产业链、技术领域。
7、可选地,在所述的确定所述业务数据的非结构化特征中,包括以下步骤:
8、从所述业务数据的名称、描述文本中剔除特殊字符,构造语句数组;
9、建立词组白名单及词组黑名单,对所述语句数组进行循环分词得到分词词组;
10、从所述分词词组中筛选所述非结构化特征。
11、可选地,在所述的从所述分词词组中筛选所述非结构化特征中,包括以下步骤:
12、基于所述分词词组作为索引,利用关键词提取算法提取关键词;
13、通过调整系数和邻接矩阵来更新概率向量,将所述概率向量转换为包含节点得分的关键词组;
14、提取设定数量且得分高的多个关键词作为所述非结构化特征。
15、可选地,所述计算公式为:
16、
17、其中,m、n分别表示待匹配业务数据的结构化特征总数和非结构化特征总数,m、n分别表示待匹配业务数据与其他所述业务数据匹配上的结构化特征匹配数和非结构化特征匹配数,a、b分别为结构化特征权重和非结构化特征权重,且a+b=1,所述结构化特征权重与所述非结构化特征权重基于用户选择进行调整。
18、可选地,所述匹配方法还包括以下步骤:
19、判断是否有所述相关性相同的所述业务数据;
20、若有,则对所述相关性相同的所述业务数据进行标记;
21、确定被标记的所述业务数据与待匹配业务数据匹配上的所述非结构化特征,并基于所述非结构化特征的对应得分计算被标记的所述业务数据的相似度;
22、根据所述相似度重新输出所述相关性相同的各所述业务数据的匹配结果。
23、可选地,在所述的计算相似度的步骤中,计算公式为:
24、
25、其中,wi表示第i项非结构化特征在待匹配业务数据中的得分,n表示待匹配业务数据的非结构化特征总数,若第i项非结构化特征匹配上则e=1,若未匹配上则为0。
26、可选地,所述匹配方法还包括以下步骤:
27、对筛选的所述非结构化特征进行分析,优化所述词组白名单及所述词组黑名单。
28、以及,一种数据智能匹配方法及系统,所述匹配系统包括:
29、数据分析模块,用于根据业务数据的内容确定所述业务数据的结构化特征及非结构化特征;
30、数据库,用于存放所述业务数据及与所述业务数据关联的所述结构化特征和所述非结构化特征;
31、数据检索模块,用于根据所述结构化特征和所述非结构化特征,计算待匹配业务数据与所述数据库内各所述业务数据的相关性,并根据所述相关性输出匹配结果。
32、可选地,所述匹配模块计算所述相关性的计算公式为:
33、
34、其中,m、n分别表示待匹配业务数据的结构化特征总数和非结构化特征总数,m、n分别表示待匹配业务数据与其他所述业务数据匹配上的结构化特征匹配数和非结构化特征匹配数,a、b分别为结构化特征权重和非结构化特征权重,且a+b=1,所述结构化特征权重与所述非结构化特征权重基于用户选择进行调整。
35、本发明由于采用上述技术方案,使其具有以下有益效果:通过对业务逻辑分析建构数据智能匹配模型,能够有效提高搜索匹配效率,且对数据的匹配度更高,效果更好,能够满足数据的精准匹配,可以更好的推送数据给用户,便于用户准确判断和应用。且能够实现模型的自我更新优化。
36、本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所指出的结构来实现和获得。
1.一种数据智能匹配方法,其特征在于,所述匹配方法包括以下步骤:
2.如权利要求1所述的数据智能匹配方法,其特征在于,所述结构化特征包括所述业务数据的产业链、技术领域。
3.如权利要求1所述的数据智能匹配方法,其特征在于,在所述的确定所述业务数据的非结构化特征中,包括以下步骤:
4.如权利要求3所述的数据智能匹配方法,其特征在于,在所述的从所述分词词组中筛选所述非结构化特征中,包括以下步骤:
5.如权利要求1所述的数据智能匹配方法,其特征在于,所述计算公式为:
6.如权利要求4所述的数据智能匹配方法,其特征在于,所述匹配方法还包括以下步骤:
7.如权利要求6所述的数据智能匹配方法,其特征在于,在所述的计算相似度的步骤中,计算公式为:
8.如权利要求3所述的数据智能匹配方法,其特征在于,所述匹配方法还包括以下步骤:
9.一种数据智能匹配系统,其特征在于,所述匹配系统包括:
10.如权利要求9所述的数据智能匹配系统,其特征在于,所述匹配模块计算所述相关性的计算公式为: