1.本发明涉及语音识别领域。更具体的说,本发明涉及一种基于语音识别的辅助面试方法及系统。
背景技术:2.当前,各大企业每年一般都会进行秋招和春招两次大规模校招,校招涉及的候选人非常多,为了更快的筛选出人才缩短招聘周期,许多岗位在一面都会采取群面即无领导小组讨论这种方式。在无领导小组面试过程中,涉及多个面试者发言,持续时间较长,面试官在此期间来不及记录每个人的表现,最终面试结束只能以自己的主观印象来决定面试者的去留。
3.随着数据处理技术的进步以及移动互联网的快速普及,计算机技术被广泛地运用到了社会的各个领域,随之而来的则是海量数据的产生。其中,语音数据受到了人们越来越多的重视。
4.语音识别是一门交叉学科,近二十年来取得了显著进步,开始从实验室走向市场,语音识别技术进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。很多专家都认为语音识别技术是信息技术领域十大重要的科拄发展技术之一,语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
技术实现要素:5.本申请实施例提供了一种基于语音识别的辅助面试方法,以至少解决相关技术中主观因素影响的问题。
6.本发明提供了一种基于语音识别的辅助面试方法,所述方法包括以下步骤:
7.构建词库步骤:设置面试核心主题,提取所述面试核心主题相关关键词构建词库;
8.记录步骤:对面试过程进行记录,生成语音文件;
9.识别步骤:对所述语音文件进行语音识别输出语音识别结果;
10.生成步骤:根据所述语音识别结果及所述词库生成面试辅助性评判文档。
11.作为本发明的进一步改进,所述识别步骤具体包括以下步骤:
12.人员识别步骤:根据所述语音文件中的发言顺序自动进行声纹注册,对面试者打上人员标签;
13.角色识别步骤:对所述语音文件进行语音识别,对面试者打上角色标签;
14.作为本发明的进一步改进,所述生成步骤具体包括以下步骤:
15.词库识别步骤:对所述语音文件进行语音识别,对说出所述词库中任一关键词的面试者打上关键词标签;
16.文档生成步骤:根据所述人员标签、所述角色标签、所述关键词标签生成所述面试辅助性评判文档。
17.作为本发明的进一步改进,所述识别步骤还包括辅助步骤,根据所述语音文件提取辅助性判断数据。
18.作为本发明的进一步改进,所述辅助性判断数据包括每位面试者发言的语句数、发言时长、交叉发言次数、发言的音量。
19.作为本发明的进一步改进,所述面试辅助性评判文档包括发言时间、发言文本、发言人。
20.作为本发明的进一步改进,所述人员识别步骤还包括抓取步骤,抓取所述语音文件中面试者自我介绍的名字打上所述人员标签。
21.作为本发明的进一步改进,所述角色标签包括领导者、控时者、记录员、总结者、其他成员。
22.基于相同发明思想,本发明还基于任一项发明创造所揭示的基于语音识别的辅助面试方法,揭示了一种基于语音识别的辅助面试系统,
23.所述基于语音识别的辅助面试系统包括:
24.构建词库模块,设置面试核心主题,提取所述面试核心主题相关关键词构建词库;
25.记录模块,对面试过程进行记录,生成语音文件;
26.识别模块,对所述语音文件进行语音识别输出语音识别结果;
27.生成模块,根据所述语音识别结果及所述词库生成面试辅助性评判文档。
28.作为本发明的进一步改进,所述识别模块包括:
29.人员识别单元,根据所述语音文件中的发言顺序自动进行声纹注册,对面试者打上人员标签;
30.角色识别单元,对所述语音文件进行语音识别,对面试者打上角色标签。
31.与现有技术相比,本发明的有益效果如下:
32.1、提出了一种基于语音识别的辅助面试方法,通过语音识别面试结束后的语音文本,帮助面试官对面试者进行评判;
33.2、涉及多个人员发言,持续时间较长的面试时,可对面试过程进行完整记录;
34.3、降低面试官的主观感受对面试结果的影响,提高无领导面试的公平性,帮助面试官更好的筛选人才。
35.本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
36.此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
37.图1是本发明实施例提供的一种基于语音识别的辅助面试方法整体流程图;
38.图2是图1所揭示的步骤s3整体流程图;
39.图3是图2所揭示的步骤s31整体流程图;
40.图4是图2所揭示的步骤s32整体流程图;
41.图5是图1所揭示的步骤s4整体流程图;
42.图6是本实施例提供的一种基于语音识别的辅助面试系统结构框架图;
43.图7是根据本发明实施例的计算机设备的框架图。
44.以上图中:
45.100、构建词库模块;200、记录模块;300、识别模块;400、生成模块;301、人员识别单元;3011、抓取单元;302、角色识别单元;303、辅助单元;401、词库识别单元;402、文档生成单元;80、总线;81、处理器;82、存储器;83、通信接口。
具体实施方式
46.为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
47.显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
48.在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
49.除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不待表针对对象的特定排序。
50.下面结合附图所示的各实施方式对本发明进行详细说明,但应当说明的是,这些实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替待,均属于本发明的保护范围之内。
51.在详细阐述本发明各个实施例之前,对本发明的核心发明思想予以概述,并通过下述若干实施例予以详细阐述。
52.本发明可基于语音识别对面试结束后的语音文本打上标签,帮助面试官对面试过程进行评判,提高面试公平性。
53.实施例一:
54.参照图1至图5所示,本实例揭示了一种基于语音识别的辅助面试方法(以下简称“方法”)的具体实施方式。
55.具体而言参照图1所示,本实施例所揭示的方法主要包括以下步骤:
56.步骤s1、设置面试核心主题,提取所述面试核心主题相关关键词构建词库。
57.其中,面试是通过书面、面谈或线上交流(视频、电话)的形式来考察一个人的工作能力与综合素质,通过面试可以初步判断应聘者是否可以融入自己的团队。是一种经过组织者精心策划的招聘活动。在特定场景下,以面试官对应聘者的交谈与观察为主要手段,由表及里测评应聘者的知识、能力、经验和综合素质等有关素质的考试活动。
58.具体而言,面试中在面临面试人员众多,面试时间不充足时经常采用无领导小组面试,无领导小组面试是一种采用情景模拟的方式对考生进行集体面试的面试考察方式,考官可以通过考生在给定情景下的应对危机、处理紧急事件以及与他人合作的状况来判断该考生是否符合岗位需要。无领导小组面试过程中一般涉及5-15位面试者,面试流程一般是:首先每个人自我介绍并对面试讨论的主题进行阐述;每个人阐述完之后开始自由发言。整个过程面试官是不会进行参与的,整场面试一般在30-50分钟左右。
59.然后执行步骤s2、对面试过程进行记录,生成语音文件。
60.生成所述语音文件后,执行步骤s3、对所述语音文件进行语音识别输出语音识别结果。
61.具体而言,在其中一些实施例中,参照图2至图4所示步骤s3具体包括以下步骤:
62.s31、根据所述语音文件中的发言顺序自动进行声纹注册,对面试者打上人员标签;
63.s32、对所述语音文件进行语音识别,对面试者打上角色标签。
64.具体而言,根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别(isolated word recognition),关键词识别(或称关键词检出,keyword spotting)和连续语音识别。其中,孤立词识别的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。
65.具体而言,在其中一些实施例中,在第一个环节(个人轮流发言)对每位面试者的声纹进行识别并根据发言顺序排序,自动声纹注册,打上人员标记,以便后续进行角色分离。也可以根据发言中自我介绍抓取到的名字进行标记,便于后续自由讨论环节中对每个面试者的发言进行匹配。声纹识别是生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认。声纹识别就是把声信号转换成电信号,再用计算机进行识别。不同的任务和应用会使用不同的声纹识别技术,例如缩小刑侦范围时可能需要辨认技术,而银行交
易时则需要确认技术。
66.具体而言,在其中一些实施例中,所述角色标签包括领导者、控时者、记录员、总结者、其他成员,但本发明并不以此为限。通过对每个人的发言语音识别然后进行标签语义化,根据已有的词库或相关话术库给每一位面试者打上一个角色标签,例如:领导者一般是整个面试过程中发言次数最多的那个,当发言中出现“那我们就按照这个思路来”,“我们接下来讨论”这种引导性的话语时能够判断出他是在扮演一个领导者的角色;“大家注意把控/控制时间”、“我们还有剩多少分钟”、“加快进度”,当多次抓取到面试者提到时间这个关键词以及相关话术的时候,就可以为其打上控时者这个角色标签;当发言中出现“我来记录一下”,等其他记录相关的关键词时,就打上记录员这个角色标签;当面试中最后发言的面试者一般是总结者,就可为其打上总结者这个角色标签;其他无明显角色关键词可以抓取的,统一打上其他人员这个角色标签。
67.所述步骤s3还包括根据所述语音文件提取辅助性判断数据。所述辅助性判断数据包括每位面试者发言的语句数、发言时长、交叉发言次数、发言的音量,但本发明并不以此为限。将这些维度的数据用于面试官后续对于面试者积极性、活跃性、管理能力、表达能力、逻辑能力提供一份判断依据。
68.然后执行步骤s4、根据所述语音识别结果及所述词库生成面试辅助性评判文档。
69.具体而言,在其中一些实施例中,参照图5所示步骤s4具体包括以下步骤:
70.s41、对所述语音文件进行语音识别,对说出所述词库中任一关键词的面试者打上关键词标签;
71.s42、根据所述人员标签、所述角色标签、所述关键词标签生成所述面试辅助性评判文档。
72.具体而言,对面试官设置的关键词,如果面试过程中面试者说出任一关键词则这个面试者可能更符合面试要求。面试一般都采用打分制,其评价标准主要为以下:能注意整体与部分之间的相互关系及协调组合,对事物的发展变化能够进行准确的分析判断;能够依据部门目标预见未来的要求,机会和不利因素,并作出计划,看清相互以来的冲突各方的关系;根据现实需要和长远效果作出适当选择,并及时决策;能够合理调配和安置人财物等有关资源;能够站在领导干部的角度对团队建设的各个层面进行准确把握,能够熟练掌握团队的构成要素和运行机制,对与团队内部角色能够进行合理定位,对于团队内外部冲突能够合理协调;能够有效掌握相关信息、及时捕捉带有倾向性、潜在性的问题,制定可行预案;正确认识和处理各种矛盾,善于协调各种利益关系;面对突发事件,头脑清醒、科学分析、准确判断、果断行动,调动各种力量,有序应对突发事件。
73.具体而言,面试辅助性评判文档,包含整个面试过程的对话记录,文档包括发言时间、发言人、发言文本,但本发明并以此为限。
74.通过本申请实施例所揭示的一种基于语音识别的辅助面试方法能够通过语音识别面试结束后的语音文本,帮助面试官对面试者进行评判,涉及多个人员发言,持续时间较长的面试时,可对面试过程进行完整记录,降低面试官的主观感受对面试结果的影响,提高无领导面试的公平性,帮助面试官更好的筛选人才。
75.本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
76.实施例二:
77.结合实施例一所揭示的一种基于语音识别的辅助面试方法,本实施例揭示了一种基于语音识别的辅助面试系统(以下简称“系统”)的具体实施示例。
78.参照图6所示,所述系统包括:
79.构建词库模块100,设置面试核心主题,提取所述面试核心主题相关关键词构建词库;
80.记录模块200,对面试过程进行记录,生成语音文件;
81.识别模块300,对所述语音文件进行语音识别输出语音识别结果;
82.生成模块400,根据所述语音识别结果及所述词库生成面试辅助性评判文档。
83.在其中一些实施例中,所述识别模块300包括:
84.人员识别单元301,根据所述语音文件中的发言顺序自动进行声纹注册,对面试者打上人员标签;
85.角色识别单元302,对所述语音文件进行语音识别,对面试者打上角色标签。
86.在其中一些实施例中,所述生成模块400包括:
87.词库识别单元401,对所述语音文件进行语音识别,对说出所述词库中任一关键词的面试者打上关键词标签;
88.文档生成单元402,根据所述人员标签、所述角色标签、所述关键词标签生成所述面试辅助性评判文档。
89.在其中一些实施例中,所述识别模块300还包括辅助单元303,根据所述语音文件提取辅助性判断数据。
90.在其中一些实施例中,所述人员识别单元301还包括抓取单元3011,抓取所述语音文件中面试者自我介绍的名字打上所述人员标签。
91.本实施例所揭示的一种基于语音识别的辅助面试系统与实施例一所揭示的一种基于语音识别的辅助面试方法中其余相同部分的技术方案,请参考实施例一所述,在此不再赘述。
92.实施例三:
93.结合图7所示,本实施例揭示了一种计算机设备的一种具体实施方式。计算机设备可以包括处理器81以及存储有计算机程序指令的存储器82。
94.具体地,上述处理器81可以包括中央处理器(cpu),或者特定集成电路(application specific integrated circuit,简称为asic),或者可以被配置成实施本申请实施例的一个或多个集成电路。
95.其中,存储器82可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器82可包括硬盘驱动器(hard disk drive,简称为hdd)、软盘驱动器、固态驱动器(solid state drive,简称为ssd)、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus,简称为usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器82可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器82可在数据处理装置的内部或外部。在特定实施例中,存储器82是非易失性(non-volatile)存储器。在特定实施例中,存储器82包括只读存储器(read-only memory,简称为rom)和随机存取存储器(random access memory,简称为ram)。在合适的情况下,该rom可以是掩模编程的rom、可编程rom
(programmable read-only memory,简称为prom)、可擦除prom(erasable programmable read-only memory,简称为eprom)、电可擦除prom(electrically erasable programmable read-only memory,简称为eeprom)、电可改写rom(electrically alterable read-only memory,简称为earom)或闪存(flash)或者两个或更多个以上这些的组合。在合适的情况下,该ram可以是静态随机存取存储器(static random-access memory,简称为sram)或动态随机存取存储器(dynamic random access memory,简称为dram),其中,dram可以是快速页模式动态随机存取存储器(fast page mode dynamic random access memory,简称为fpmdram)、扩展数据输出动态随机存取存储器(extended date out dynamic random access memory,简称为edodram)、同步动态随机存取内存(synchronous dynamic random-access memory,简称sdram)等。
96.存储器82可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器81所执行的可能的计算机程序指令。
97.处理器81通过读取并执行存储器82中存储的计算机程序指令,以实现上述实施例中的任意一种基于语音识别的辅助面试方法。
98.在其中一些实施例中,计算机设备还可包括通信接口83和总线80。其中,如图7所示,处理器81、存储器82、通信接口83通过总线80连接并完成相互间的通信。
99.通信接口83用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。通信端口83还可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
100.总线80包括硬件、软件或两者,将计算机设备的部件彼此耦接在一起。总线80包括但不限于以下至少之一:数据总线(data bus)、地址总线(address bus)、控制总线(control bus)、扩展总线(expansion bus)、局部总线(local bus)。举例来说而非限制,总线80可包括图形加速接口(accelerated graphics port,简称为agp)或其他图形总线、增强工业标准架构(extended industry standard architecture,简称为eisa)总线、前端总线(front side bus,简称为fsb)、超传输(hyper transport,简称为ht)互连、工业标准架构(industry standard architecture,简称为isa)总线、无线带宽(infiniband)互连、低引脚数(low pin count,简称为lpc)总线、存储器总线、微信道架构(micro channel architecture,简称为mca)总线、外围组件互连(peripheral component interconnect,简称为pci)总线、pci-express(pci-x)总线、串行高级技术附件(serial advanced technology attachment,简称为sata)总线、视频电子标准协会局部(video electronics standards association local bus,简称为vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线80可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
101.该计算机设备可以基于语音识别对面试过程进行标签标注,从而实现结合图1描述的方法。
102.另外,结合上述实施例中辅助面试的方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种基于语音识别的辅助面试方法。
103.以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实
施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
104.综上所述,基于本发明的有益效果在于,提出了一种基于语音识别的辅助面试方法能够通过语音识别面试结束后的语音文本,帮助面试官对面试者进行评判,涉及多个人员发言,持续时间较长的面试时,可对面试过程进行完整记录,降低面试官的主观感受对面试结果的影响,提高无领导面试的公平性,帮助面试官更好的筛选人才。
105.以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。