面向定制化需求的人员排序方法及装置

文档序号:33637772发布日期:2023-03-29 01:11阅读:42来源:国知局
面向定制化需求的人员排序方法及装置

1.本发明涉及电子信息及数据处理技术领域,尤其涉及面向定制化需求的人员排序方法及装置。


背景技术:

2.数据分析人员根据特定的任务需求会关注位于特定地区、就职过特定单位、参与过特定工程项目、具备特定技能的人员,在获得一定范围内人员的简历后,如何向数据人员按与任务需求匹配性大小推送相关的人员,成为一个亟待解决的问题。目前主要是靠关键词检索匹配分析,通过一个或者数个关键词匹配到相关的简历人员,这种关键词检索匹配的方法很难从人员所从事的全部信息进行匹配,只考虑了需求关键词与简历文本的相关性,没有充分考虑到简历文本的内聚性。因此,需要一种既考虑定制化需求与简历文本相关性,又要考虑简历文本内聚性的智能算法去实现定制化需求的人员挖掘。


技术实现要素:

3.鉴于上述现有定制化需求下人员挖掘存在的问题,本发明的目的在于提供面向定制化需求的人员排序方法及装置,实现智能化简历人员挖掘。
4.为了解决上述技术问题,本发明实施例第一方面公开了面向定制化需求的人员排序方法,方法包括:s1,获取定制化需求、简历文本集合;所述简历文本集合包括至少一条简历文本;s2,对所述定制化需求进行处理,得到关键词集合;所述关键词集合包含至少一个关键词;s3,对所述关键词集合进行处理,得到所有关键词的权重系数;所述权重系数满足约束条件,所述n表征所述关键词集合包含关键词的个数,所述j为所述关键词集合的关键词对应的序号,所述表征所述关键词集合第j个关键词的权重系数;s4,遍历所述简历文本集合,计算每条简历文本与所述关键词集合的匹配性得分;s5,按照所述匹配性得分从高到低顺序,将所述简历文本集合中简历文本进行排序,得到人员排序信息。
5.作为一种可选的实施方式,在本发明实施例第一方面中,所述定制化需求为定制词集合,或,定制文本段;所述定制词集合包含至少一个定制词。
6.作为一种可选的实施方式,在本发明实施例第一方面中,所述获取所述定制化需求的关键词集合包括:如果所述定制化需求为定制词集合,确定所述定制词集合为关键词集合;如果所述定制化需求为定制文本段,利用关键词提取算法,得到代表所述定制文本段的定制文本段关键词集合,将所述定制文本段关键词集合确定为关键词集合。所述关键词提取算法无监督的算法,可以为基于统计特征的关键词提取(tf-idf)、基于词图模型
的关键词提取(textrank)、基于主题模型的关键词提取。
7.作为一种可选的实施方式,在本发明实施例第一方面中,所述对所述关键词集合进行处理,得到所有关键词的权重系数,包括:依据定制化需求的任务需要,计算所述关键词集合中每个关键词权重大小,得到所有关键词的权重系数,或,依据从关键词提取算法中得到的关键词节点权重大小,确定所有关键词的权重系数。
8.作为一种可选的实施方式,在本发明实施例第一方面中,所述计算每条简历文本与所述关键词集合的匹配性得分,包括:遍历所述关键词集合,对其中任一所述关键词,计算该关键词与所述简历文本的匹配分;所述i表征顺序;根据预设的匹配模型,计算简历文本与所述关键词集合的匹配性得分;所述m表征所述简历文本集合中第m条简历文本。
9.所述预设的匹配模型为:式中,表示所述简历文本集合中第m条简历文本与所述关键词集合匹配性得分,n表示所述关键词集合中关键词总数,表示第i个关键词的权重系数,表示第i个关键词的与第m条简历文本的匹配分。
10.作为一种可选的实施方式,在本发明实施例第一方面中,所述计算所述关键词与所述简历文本的匹配分,包括:预处理所述简历文本,得到简历文本的相关词集合;所述相关词集合包含至少一个相关词;遍历所述相关词集合,利用预设的词向量相关模型,计算所述相关词集合中任一相关词与所述关键词的相关系数;所述词向量相关模型为:式中,表示所述该关键词的词向量,表示所述相关词集合中第j个单词的词向量,表示与的协方差,表示的方差,表示的方差;将所述相关词集合中所有相关词所对应的降序排列,取相关系数最大的前y个相关词,得到最优相关词集合,所述y为大于0的自然数;利用预设的关键词与简历文本匹配模型,计算所述关键词与所述简历文本的第
一匹配分;所述关键词与简历文本匹配模型为:式中,y表示所述最优相关词集合中相关词的个数,表示所述该关键词与所述最优相关词集合中相关词的相关系数。
11.利用预设的简历文本内聚模型,计算所述最优相关词集合中任意两个相关词的相关性,得到所述简历文本的第二匹配分;所述简历文本内聚模型为:式中,y表示所述最优相关词集合中相关词的个数,表示所述最优相关词集合中任意两个相关词和的相关系数,所述i,j表征顺序;将第一匹配分与第二匹配分相乘,得到所述关键词与所述简历文本的匹配分,计算公式如下:式中,表示所述关键词与所述简历文本的第一匹配分,表示所述简历文本的第二匹配分。
12.作为一种可选的实施方式,在本发明实施例第一方面中,所述预处理所述简历文本,得到简历文本相关词集合,包括:去除所述简历文本中干扰字符,得到清洗后的简历文本;所述干扰字符包括但不限于制表符、特殊字符;加载停用词表,对所述清洗后的简历文本进行分词、去停用词,得到简历文本相关词集合。
13.本发明实施例第二方面公开了面向定制化需求的人员排序装置,所述装置包括:获取模块,用于获取定制化需求、简历文本集合;所述简历文本集合包括至少一条简历文本;所述定制化需求为定制词集合,或,定制文本段;关键词处理模块,用于提取定制化需求的关键词集合,计算关键词的权重系数;简历文本预处理模块,用于对简历文本进行预处理,得到简历文本相关词集合;所述相关词集合包含至少一个相关词;匹配性得分计算模块,用于计算关键词集合和简历文本的匹配性得分;人员排序模块,用于将所述简历文本集合中简历文本,按匹配性得分从高到低顺序,得到人员排序信息。
14.作为一种可选的实施方式,在本发明实施例第二方面中,所述关键词处理模块提取定制化需求的关键词集合,计算关键词的权重系数,包括:
如果所述定制化需求为定制词集合,确定所述定制词集合为关键词集合;如果所述定制化需求为定制文本段,利用关键词提取算法,得到代表所述定制文本段的定制文本段关键词集合,将所述定制文本段关键词集合确定为关键词集合。
15.依据定制化需求的任务需要,计算所述关键词集合中每个关键词权重大小,得到所有关键词的权重系数,或,依据从关键词提取算法中得到的关键词节点权重大小,确定所有关键词的权重系数。
16.作为一种可选的实施方式,在本发明实施例第二方面中,所述简历文本预处理模块,用于对简历文本进行预处理,得到简历文本相关词集合,包括:去除所述简历文本中干扰字符,得到清洗后的简历文本;所述干扰字符包括但不限于制表符、特殊字符;加载停用词表,对所述清洗后的简历文本进行分词、去停用词,得到简历文本相关词集合。
17.作为一种可选的实施方式,在本发明实施例第二方面中,所述匹配性得分计算模块,用于计算关键词集合和简历文本的匹配性得分,包括:遍历所述关键词集合,对其中任一所述关键词,计算该关键词与所述简历文本的匹配分;所述i表征顺序;判断是否完成所述关键词集合中所有关键词的与所述简历文本的匹配分的计算,得到第一判断结果;如果第一判断结果为否,触发执行遍历所述关键词集合,对其中任一所述关键词,计算该关键词与所述简历文本的匹配分;如果第一判断结果为是,则根据预设的匹配模型,计算简历文本与所述关键词集合的匹配性得分;所述m表征所述简历文本集合中第m条简历文本;所述预设的匹配模型为:式中,表示所述简历文本集合中第m条简历文本与所述关键词集合匹配性得分,n表示所述关键词集合中关键词总数,表示第i个关键词的权重系数,表示第i个关键词的与第m条简历文本的匹配分。
18.作为一种可选的实施方式,在本发明实施例第二方面中,所述计算所述关键词与所述简历文本的匹配分,包括:遍历从所述简历文本预处理模块得到的相关词集合,利用预设的词向量相关模型,计算所述相关词集合中任一相关词与所述关键词的相关系数;所述词向量相关模型为:
式中,表示所述该关键词的词向量,表示所述相关词集合中第j个单词的词向量,表示与的协方差,表示的方差,表示的方差;将所述相关词集合中所有相关词所对应的降序排列,取相关系数最大的前y个相关词,得到最优相关词集合;所述y为大于0的自然数;利用预设的关键词与简历文本匹配模型,计算所述关键词与所述简历文本的第一匹配分;所述关键词与简历文本匹配模型为:式中,y表示所述最优相关词集合中相关词的个数,表示所述该关键词与所述最优相关词集合中相关词的相关系数;利用预设的简历文本内聚模型,计算所述最优相关词集合中任意两个相关词的相关性,得到所述简历文本的第二匹配分;所述简历文本内聚模型为:式中,y表示所述最优相关词集合中相关词的个数,表示所述最优相关词集合中任意两个相关词和的相关系数,所述i,j表征顺序;将第一匹配分与第二匹配分相乘,得到所述关键词与所述简历文本的匹配分;所述匹配分为:式中,表示所述关键词与所述简历文本的第一匹配分,表示所述简历文本的第二匹配分。
19.本发明的有益效果:本发明所述的面向定制化需求的人员排序方法及装置,输入定制化需求,提取定制化需求的关键词集合,获取简历文本集合,遍历所述简历文本集合,计算每条简历文本与所述关键词集合的匹配性得分,将所述简历文本集合中简历文本,按所述匹配性得分从高
到低顺序,得到人员排序信息。本发明所述方法构建了基于定制化需求的简历人物排序模型,所述方法中不仅反映了简历文本与关键词匹配的单词的相关性,还反映了简历文本的主题对定制需求的内聚度大小,解决了目前关键词匹配的方法只关注了局部的信息,忽略简历文本内聚度的问题,为面向定制需求的人员排序提供了一种可用的方法,可用于数据人员根据定制化需求进行精准的重要目标人物挖掘。
附图说明
20.图1是本发明实施例公开的面向定制化需求的人员排序方法流程示意图;图2是本发明实施例公开的面向定制化需求的人员排序装置的结构示意图。
具体实施方式
21.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
22.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
23.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
24.本发明公开了面向定制化需求的人员排序方法及装置,本发明涉及电子信息及数据处理技术领域,尤其涉及面向定制化需求的人员排序方法及装置。所述方法包括输入定制化需求,提取定制化需求的关键词集合,获取简历文本集合,遍历所述简历文本集合,计算每条简历文本与所述关键词集合的匹配性得分,将所述简历文本集合中简历文本,按所述匹配性得分从高到低顺序,得到人员排序信息。以下分别进行详细说明。
25.实施例一图1是本发明实施例公开的面向定制化需求的人员排序方法流程示意图。其中,图1所描述的面向定制化需求的人员排序方法应用于数据人员进行特定人员发现的挖掘系统中,如用于面向定制化需求任务进行简历人员相关性排序的的本地服务器或云端服务器等,本发明实施例不做限定。如图1所示,该面向定制化需求的人员排序方法可以包括以下操作:s1.获取定制化需求、简历文本集合。
26.本发明实施例中,上述简历文本集合包括至少一条简历文本;可选的,本发明实施例中,上述定制化需求可以为定制词集合,也可以为定制文本段,所述定制词集合包含至少一个定制词。
27.可选的,所述简历文本集合获取方式包括:通过存储介质导入、通过网络导入、通过服务器导入。
28.可见,多种的简历文本集合获取方式利于用户的简历文本集合的导入,提升了用户体验感。
29.可选的,所述简历文本集合中简历文本为txt文本文件。
30.可选的,原始简历文件可以从地方公司hr或互联网招聘网站上获取,原始简历文件所述可以为pdf、doc和docx等格式的电子简历文件,使用工具软件,如doctotext、pdftotext等,将原始简历文件进行简历文本的提取,并保存成对应的txt文本文件,得到txt格式的所述简历文本。
31.可见,原始简历文件来源非常广泛,可以为多种格式,通过常见的工具软件转换为txt格式的简历文本,为数据人员获取简历提供了广泛的途径。
32.s2.对定制化需求进行处理,得到关键词集合。
33.可选的,如果所述定制化需求为定制词集合,确定所述定制词集合为关键词集合;如果所述定制化需求为所述定制文本段,利用现有的关键词提取算法,如textrank算法,提取能代表所述定制文本段的定制文本段关键词集合,确定所述定制文本段关键词集合为关键词集合。
34.可见,本发明实施例所描述的面向定制化需求的人员排序方法中所述定制化需求可以是一组定制词,也可以是一段描述文本,可适应不同的定制需求。
35.s3.对关键词集合进行处理,得到所有关键词的权重系数。
36.所述权重系数满足约束条件,所述n表征所述关键词集合包含关键词的个数,所述j为所述关键词集合的关键词对应的序号,所述表征所述关键词集合第j个关键词的权重系数;可选的,本发明实施例中,依据所述关键词集合中每个关键词权重大小,确定所述关键词的权重系数;需求大小相同,则每个关键词的权重系数都同为,所述n为关键词的个数。
37.或,依据关键词提取算法得到的关键词节点权重大小,确定所述关键词的权重系数。例如,在关键词提取算法中,第j个关键词的节点权重大小为进行相应比例的权重系数赋值,第j个关键词权重系数计算方法如下:式中,表示第j个关键词权重系数,表示关键词提取算法中第j个关键词的节点权重,n表示关键词集合包含关键词的个数。
38.可见,将定制化需求提炼为关键词集合,使需求更精准;赋予每个关键词不同的权重系数,使核心需求可以获得更高的匹配性得分。
39.s4.遍历简历文本集合,计算每条简历文本与关键词集合的匹配性得分。
40.s5.按照匹配性得分从高到低顺序,将简历文本集合中简历文本进行排序,得到人员排序信息。
41.可见,实施本发明实施例所描述的面向定制化需求的人员排序方法通过对定制化需求与简历文本的匹配性计算,得到定制化需求与简历文本的匹配性得分,根据匹配性得分的高低得到简历文本所对应的人员与定制需求的关联度大小,为面向定制需求的人员排序提供了一种可用的方法。
42.在一个可选的实施例中,上述步骤s4中计算每条简历文本与所述关键词集合的匹配性得分,包括:遍历所述关键词集合,对其中任一关键词计算所述关键词与所述简历文本的匹配分,所述表征第i个关键词,所述i表征顺序;所述匹配性得分等于所述关键词集合中所有关键词组所述匹配分与所述权重系数乘积的总和,计算方法如下:式中,表示所述简历文本集合中第m条简历文本对应人物的匹配性得分,n表示所述关键词集合中关键词总数,表示第i个关键词的相关系数,表示第i个关键词的与第m条简历文本的匹配分。
43.可选的,上述计算所述关键词与所述简历文本的匹配分,包括:预处理所述简历文本,得到简历文本的相关词集合,所述相关词集合包含至少一个相关词;遍历所述相关词集合,计算所述相关词集合中任一相关词与所述该关键词的相关系数,记作,计算公式如下:式中,表示所述该关键词的词向量,表示所述相关词集合中第j个单词的词向量,表示与的协方差,表示的方差,表示的方差;将所述相关词集合中所有相关词所对应的降序排列,取相关系数最大的前y个相关词,得到最优相关词集合,所述y为大于0的自然数;计算所述该关键词与所述简历文本的第一匹配分,公式如下:式中,m表示所述最优相关词集合中相关词的个数,表示所述该关键词
与所述最优相关词集合中相关词的相关系数。
44.计算所述最优相关词集合中任意两个相关词的相关性,得到所述简历文本的第二匹配分,计算公式如下:式中,y表示所述最优相关词集合中相关词的个数,表示所述最优相关词集合中任意两个相关词和,所述i,j表征顺序;将第一匹配分与第二匹配分相乘,得到所述关键词与所述简历文本的匹配分,计算公式如下:式中,表示所述关键词与所述简历文本的第一匹配分,表示所述简历文本的第二匹配分。
45.可选的,上述预处理所述简历文本,得到简历文本的相关词集合,包括:去除所述简历文本中干扰字符,得到清洗后的简历文本;所述干扰字符包括但不限于制表符、特殊字符;加载停用词表,对所述清洗后的简历文本进行分词、去停用词,得到简历文本相关词集合。
46.可见,实施本发明实施例所描述的面向定制化需求的人员排序方法能够输入定制化需求,提取定制化需求的关键词集合,获取简历文本集合,遍历所述简历文本集合,计算每条简历文本与所述关键词集合的匹配性得分,将所述简历文本集合中简历文本所对应的人员按所述匹配性得分从高到低排序,得到并输出人员排序信息。本发明所述方法构建了基于定制化需求的简历人物排序模型,所述方法中不仅反映了简历文本与关键词匹配的单词的相似性,也反映了简历文本的主题对定制需求的内聚度大小,解决了目前关键词匹配的方法只关注了局部的信息,忽略了简历文本内聚度的问题,为面向定制需求的人员排序提供了一种可用的方法。
47.实施例二图2是本发明实施例公开的面向定制化需求的人员排序装置结构示意图。其中,图2所描述的面向定制化需求的人员排序装置应用于数据人员进行特定人员发现的挖掘系统中,如用于面向定制化需求任务进行简历人员相关性排序的本地服务器或云端服务器等,本发明实施例不做限定。如图2所示,该面向定制化需求的人员排序装置可以包括:获取模块201,用于获取定制化需求、简历文本集合。
48.关键词处理模块202,用于提取定制化需求的关键词集合,计算关键词的权重系数;简历文本预处理模块203,用于对简历文本进行预处理,得到简历文本相关词集合;
匹配性得分计算模块204,用于计算关键词集合和简历文本的匹配性得分;人员排序模块205,用于将所述简历文本集合中简历文本,按匹配性得分从高到低顺序,得到人员排序信息。
49.可见,实施图2所描述的面向定制化需求的人员排序装置,能够通过对定制需求和简历文本集合进行匹配性计算,得到简历文本所对应人员与定制化需求的匹配度,进而得到人员排序信息,提高了数据人员根据定制化需求进行精准的重要目标人物挖掘的效率和准确率。
50.可选的,上述关键词处理模块202提取定制化需求的关键词集合,计算关键词的权重系数,具体方式为:如果所述定制化需求为定制词集合,确定所述定制词集合为关键词集合;如果所述定制化需求为定制文本段,利用关键词提取算法,得到代表所述定制文本段的定制文本段关键词集合,将所述定制文本段关键词集合确定为关键词集合。
51.依据定制化需求的任务需要,计算所述关键词集合中每个关键词权重大小,得到所有关键词的权重系数,或,依据从关键词提取算法中得到的关键词节点权重大小,确定所有关键词的权重系数。
52.可选的,上述简历文本预处理模块203对简历文本进行预处理,得到简历文本相关词集合,具体方式为:去除所述简历文本中干扰字符,得到清洗后的简历文本;所述干扰字符包括但不限于制表符、特殊字符;加载停用词表,对所述清洗后的简历文本进行分词、去停用词,得到简历文本相关词集合。
53.可选的,上述匹配性得分计算模块204计算关键词集合和简历文本的匹配性得分,具体方式为:遍历所述关键词集合,对其中任一所述关键词,计算该关键词与所述简历文本的匹配分;所述i表征顺序;判断是否完成所述关键词集合中所有关键词的与所述简历文本的匹配分的计算,得到第一判断结果;如果第一判断结果为否,触发执行遍历所述关键词集合,对其中任一所述关键词,计算该关键词与所述简历文本的匹配分;如果第一判断结果为是,则根据预设的匹配模型,计算简历文本与所述关键词集合的匹配性得分;所述m表征所述简历文本集合中第m条简历文本;所述预设的匹配模型为:式中,表示所述简历文本集合中第m条简历文本与所述关键词集合匹配性得分,n表示所述关键词集合中关键词总数,表示第i个关键词的权重系数,表示第i个关键词的与第m条简历文本的匹配分。
54.可选的,上述匹配性得分计算模块204计算所述关键词与所述简历文本的匹配分,包括:遍历从所述简历文本预处理模块得到的相关词集合,利用预设的词向量相关模型,计算所述相关词集合中任一相关词与所述关键词的相关系数;所述词向量相关模型为:式中,表示所述该关键词的词向量,表示所述相关词集合中第j个单词的词向量,表示与的协方差,表示的方差,表示的方差;将所述相关词集合中所有相关词所对应的降序排列,取相关系数最大的前y个相关词,得到最优相关词集合;所述y为大于0的自然数;利用预设的关键词与简历文本匹配模型,计算所述关键词与所述简历文本的第一匹配分;所述关键词与简历文本匹配模型为:式中,y表示所述最优相关词集合中相关词的个数,表示所述该关键词与所述最优相关词集合中相关词的相关系数;利用预设的简历文本内聚模型,计算所述最优相关词集合中任意两个相关词的相关性,得到所述简历文本的第二匹配分;所述简历文本内聚模型为:式中,y表示所述最优相关词集合中相关词的个数,表示所述最优相关词集合中任意两个相关词和相关系数,所述i,j表征顺序;将第一匹配分与第二匹配分相乘,得到所述关键词与所述简历文本的匹配分;所述匹配分为:
式中,表示所述关键词与所述简历文本的第一匹配分,表示所述简历文本的第二匹配分。
55.可见,利用匹配性得分计算模块不仅计算了简历文本与关键词匹配的单词的相关性,还计算了简历文本的主题对定制需求的内聚度大小,解决了目前关键词匹配的方法只关注了局部的信息,忽略简历文本内聚度的问题。
56.最后应说明的是:本发明实施例公开的面向定制化需求的人员排序方法及装置所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1