一种语音录入结构化数据的方法、系统及电子设备与流程

文档序号:26587319发布日期:2021-09-10 19:44阅读:112来源:国知局
一种语音录入结构化数据的方法、系统及电子设备与流程

1.本发明属于计算机应用技术领域,更具体的是涉及一种语音录入结构化数据的方法、系统及电子设备。


背景技术:

2.现有目前的家政行业,家政从业者给家政平台发布求职信息或其他需与家政平台交互时,一般是家政从业者手动录入各种信息数据,以及完成需求、线索、订单等信息的录入,因录入项目相对较多且繁琐,需逐个通过文字录入信息,录入效率低,导致家政从业者对繁琐复杂的录入过程体验差,耗费时间长。


技术实现要素:

3.本发明的主要目的在于提出一种语音录入结构化数据的方法、系统及电子设备,以期至少部分地解决上述技术问题。
4.为解决上述技术问题,本发明的一方面提出一种语音录入结构化数据的方法,包括:获取用户录入的语音信息,将该语音信息转化为文本信息,对所述文本信息进行分词,识别分词后的文本信息中的字段及字段内容,以生成结构化数据,提供界面以向所述用户展示所述结构化数据,并接收用户输入以对所述结构化数据进行编辑,存储所述结构化数据。
5.作为本发明第二方面提出一种语音录入结构化数据的系统,包括:
6.通过客户端录入语音信息;
7.服务端获取用户在客户端录入的语音信息,将该语音信息转化为文本信息;
8.服务端对所述文本信息进行分词;
9.服务端识别分词后的文本信息中的字段及字段内容,生成结构化数据;
10.服务端提供界面以向所述用户在客户端展示所述结构化数据,并接收用户在客户端的输入信息以对所述结构化数据进行编辑并再次上传服务端;
11.服务端存储所述结构化数据。
12.本发明第三方面提出一种服务器,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行所述的语音录入结构化数据的方法。
13.本发明第五方面还提出一种计算机可读介质,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现所述语音录入结构化数据的方法。
14.基于上述技术方案可知,本发明的语音录入结构化数据的方法相对于现有技术至少具有如下有益效果之一:
15.本发明根据行业词库及核心词汇进行识别,使语音文本自动纠错,降低用户在语音录入时因读音导致的内容错误。
16.本发明可以通过借助语义分析,对核心词汇进行识别,可以一次性录入多个信息,
有效降低了文字输入的时间成本。
附图说明
17.图1是本发明的一种语音录入结构化数据方法的流程图。
18.图2是本发明的一个实施例的语音录入结构化数据方法的示意性流程图。
19.图3是本发明的一个实施例的客户端/服务器的结构关系图。
20.图4是根据本发明的一示例性实施例示出的语音录入结构化数据方法的应用系统框图。
21.图5是本发明的一个实施例的电子设备的结构示意图。
22.图6是本发明的一个实施例的计算机可读记录介质的示意图。
具体实施方式
23.在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
24.附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
25.附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理单元装置和/或微控制器装置中实现这些功能实体。
26.各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
27.为解决上述技术问题,本发明提出语音录入结构化数据的方法、系统及电子设备。
28.在本发明中,客户端是指任何能够与其他电子设备进行数据传输的电子设备,包括台式电脑、笔记本电脑、平板电脑、手机等设备。
29.所述的客户端通常提供有人机交互接口,包括例如显示器或显示屏、鼠标、键盘等,显示器或显示屏通常具有可视化交互界面。诸如手机等移动智能客户端,人机交互接口通常是触摸屏和按键。无论如何,用户可以通过人机接口与客户端进行交互。
30.所述本发明的客户端主要应用于以文件方式存储数据的客户端,例如装有windows、ios、android等操作系统电脑、手机、服务端等。
31.图1是本发明的一种语音录入结构化数据方法的流程图。如图1所示,所述语音录入结构化数据的方法,包括:获取用户录入的语音信息,将该语音信息转化为文本信息,对
所述文本信息进行分词,识别分词后的文本信息中的字段及字段内容,以生成结构化数据,提供界面以向所述用户展示所述结构化数据,并接收用户输入以对所述结构化数据进行编辑,存储所述结构化数据。
32.在一个优选实施方式中,还包括:提供操作界面,所述操作界面包括:语音录入操作区,信息显示修订区,其中,
33.所述语音录入操作区用于用户开始或终止语音录入任务;
34.所述信息显示修订区用于对用户输入以对所述结构化数据进行编辑。
35.在一个优选实施方式中,所述用户录入的语音信息包括:通过用户在语音录入操作区点击语音录入,记录用户在终止语音录入前所产生的语音音频。
36.在一个优选实施方式中,将所述语音信息上传至服务端转为文本信息;
37.所述方法还包括将用户生成文本信息到服务端进行语音分词,所述语音分词为根据语音文本特征自动截取。
38.优选地,所述识别分词后的文本信息中的字段及字段内容生成的结构化数据包括:用户必要文字信息及目的文字信息。
39.优选地,截取11位连续数字作为用户联系方式;
40.截取省市地址信息作为用户联系地址;
41.以及根据核心词汇匹配用户其他语音数据。
42.优选地,还包括:所述服务器接收来自多个客户端上传的语音信息的语音信息,并反馈结构化数据到多个客户端,待用户编辑后再次上传至服务端并存储所述结构化数据。
43.优选地,对多个用户录入的语音信息进行管理,包括:
44.将不同的用户录入的语音信息加入语音录入任务队列;
45.将语音录入任务队列分发到不同的处理器或处理装置进行处理。
46.本发明还公开了一种语音录入结构化数据的系统,其特征在于,包括:
47.用户通过客户端录入语音信息;
48.服务端获取用户在客户端录入的语音信息,将该语音信息转化为文本信息;
49.服务端对所述文本信息进行分词;
50.服务端识别分词后的文本信息中的字段及字段内容,生成结构化数据;
51.服务端提供界面以向所述用户在客户端展示所述结构化数据,并接收用户在客户端的输入信息以对所述结构化数据进行编辑并再次上传服务端;
52.服务端存储所述结构化数据。
53.本发明还公开了一种语音录入结构化数据的服务器,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行所述的方法,所述处理器用于执行如下步骤:
54.根据本发明的优选实施方式,所述任务服务器与文本字段生成服务器为同一服务器,所述任务服务器还用于执行:从客户端接收所述视语音录入任务;
55.根据本发明的优选实施方式,所述任务服务器还用于执行:将所述结构化数据发送给所述客户端;
56.根据本发明的优选实施方式,所述任务服务器与结构化数据服务器不是同一服务器,所述结构化数据服务器还用于执行:将所述结构化数据上传到任务服务器。
57.在一个优选实施方式中,本发明还提出一种计算机可读介质,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现所述的方法。
58.为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
59.在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
60.附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
61.附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理单元装置和/或微控制器装置中实现这些功能实体。
62.各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
63.步骤s101,获取用户录入的语音信息,将该语音信息转化为文本信息。
64.图2是本发明的一个实施例的语音录入结构化数据方法的示意性流程图。如图2所示,用户在客户端打开语音录入信息页面,点击功能界面开始语音录入,客户端记录当前用户产生的音频作为语音信息,所述用户录入的语音信息包括:通过用户在语音录入操作区点击语音录入,记录用户在终止语音录入前所产生的语音音频,将该语音音频转化为文本信息,上传至服务端。
65.作为一种优选的实施方式,所述获取语音信息主要通过客户端输入设备,所述输入设备可以包括:麦克风、耳机和/或话筒等任何音频输入设备。在用户录入语音信息的过程中,客户端会弹出语音录入对话框,开对话框会适当提示用户录入的关键词例如:姓名、地址、工作经历、所需岗位等
66.所述客户端特定界面为客户端提供一操作界面用于用户操作并与所述服务器交互,所述操作界面包括:语音录入操作区,信息显示修订区。
67.在实施例中,所述客户端特定界面为客户端提供一操作界面用于用户还可以与所述服务器交互。需要说明的是,所述语音录入操作区用于用户开始或终止语音录入任务,包括语音录入开始功能键、语音录入终止功能键,以及当重新录入功能键等,所述语音录入开始功能键可以为单击开始连续录音功能或长按开始连续录音功能,所述语音录入终止功能键可以为单击终止语音录入功能,所述重新录入功能键也可以为长按语音录入开始功能键中途上滑,或另一单独功能键作用于重新语音录入功能。所述信息显示修订区用于对用户
输入以对所述结构化数据进行编辑,用户可以在语音录入后对服务端反馈的文字信息进行修改编辑,该区域包括文字输入、笔画输入和/或语音输入等任何可对数据进行编辑的功能。
68.步骤s102,对所述文本信息进行分词。
69.客户端发送文本信息到服务端,服务端会对所述文本信息进行分词,所述语音分词为根据语音文本特征自动截取,该文本特征包括:对数字与文字进行分词,例如截取11位连续数字作为用户联系方式,截取省市地址信息作为用户联系地址,以及根据核心词汇匹配用户其他语音数据,所述根据核心词汇包括但不限于:育婴师、育儿、陪护等家政行业专用词汇,借助语义分析,对核心词汇进行识别,比如“地址”,则将后续内容填写到地址中,“联系方式”,则将该信息填写到联系方式中。
70.在实施例中在这个过程中还包括根据行业分词系统对识别后的文字进行自动纠错,例如:语音室

育婴师、鱼饵

育儿等,其中,作为优选的实施方式,所述用户在录入的语音信息时可以录入单个信息,例如:姓名、联系方式、地址等。进一步地,也可以通过连续的语音信息一次性录入多个语音信息,例如,姓名张三、电话158***、地址北京市昌平区**406,借助语义分析,对诸如姓名、联系方式、地址等核心词汇进行识别。将不同信息填入不同的信息区域。
71.步骤s103,识别分词后的文本信息中的字段及字段内容,以生成结构化数据。
72.所述识别分词后的文本信息中的字段及字段内容生成的结构化数据包括:用户必要文字信息,诸如:姓名、联系方式、年龄、居住地等,所述目的文字信息包括但不限于:工作岗位、目标薪资、工作经验等,例如当用户对育婴师发布面试信息时,所需的必要文字信息为:张阿姨、158**、 43岁,目的文字信息为:育婴师、薪酬8k、工作经验5年,有丰富的
……

73.进一步地,服务端将以上文本信息结构化数据,区分必要文字信息及目的文字信息,将该结构化数据反馈至客户端用户界面。
74.步骤s104,提供界面以向所述用户展示所述结构化数据,并接收用户输入以对所述结构化数据进行编辑。
75.服务端反馈用户的结构化数据到客户端,用户可以在客户端对该数据在信息显示修订区进行预览以及编辑。
76.步骤s105,存储所述结构化数据。
77.所述服务器接收来自多个客户端上传的语音信息的语音信息,并反馈结构化数据到多个客户端,待用户编辑后再次上传至服务端并存储所述结构化数据。当用户确认所述服务端反馈的结构化数据无误或经编辑后无误,可在可通过客户端的功能键上传最终结构化数据到服务端并存储。
78.在实施例中,所述服务器接收来自多个客户端上传的语音信息,并反馈语音录入结构化数据到多个客户端,为了更有效的提高语音录入结构化数据的效率,对多个用户录入的语音信息进行管理,包括:将不同的用户录入的语音信息加入语音录入任务队列,将语音录入任务队列分发到不同的处理器或处理装置进行处理。
79.图3是本发明的一个实施例的客户端/服务器的结构关系图。如图3 所示,用户在客户端打开语音录入信息页面,点击功能界面开始语音录入,客户端记录当前用户产生的音频作为语音信息,用户通过客户端录入语音信息,服务端获取用户在客户端录入的语音
信息,将该语音信息转化为文本信息,服务端对所述文本信息进行分词,服务端识别分词后的文本信息中的字段及字段内容,生成结构化数据,服务端提供界面以向所述用户在客户端展示所述结构化数据,并接收用户在客户端的输入信息以对所述结构化数据进行编辑并再次上传服务端,服务端存储所述结构化数据。
80.图4是根据本发明的一示例性实施例示出的语音录入结构化数据方法的应用系统框图。
81.如图4所示,系统架构400可以包括客户端设备401、402、403,网络404和服务端405。网络404用以在客户端设备401、402、403和服务端505之间提供通信链路的介质。网络404可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
82.用户可以使用客户端设备401、402、403通过网络404与服务端405 交互,以接收或发送消息等。客户端设备401、402、403上可以安装有各种用于家政行业的app。
83.客户端设备401、402、403可以是具有显示屏并且支持app浏览的各种电子设备,并具有ios或安卓操作系统,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
84.客户端设备401、402、403可例如发送和/或接收所述用户通过网络下载和/或上传的家政行业信息;客户端设备401、402、403可用于用户浏览和/或上传信息等操作,所述操作是指用户通过客户端上的家政行业平台进行的浏览和/或发布信息操作;客户端设备401、402、403可例如根据用户在上传家政行业平台进行转发和/或评论操作。
85.服务端405可以是提供各种服务的服务端,例如对用户利用客户端设备401、402、403所浏览的家政行业类提供支持的后台管理服务端。服务端405可以对接收到的用户对客户端设备401、402、403上进行的下载、上传、接收、浏览、编辑、转发和/或评论操作进行管理,所述管理可以包括个人信息、结构化数据、评论言论的真实性等可能需要工作员工操作控制的内容和/或操作。
86.服务端405还可以是提供各种服务的服务端,例如对用户利用客户端设备401、402、403所发送和/或接收的用户通过网络下载和/或上传的结构化数据提供支持的服务端。例如用户通过客户端设备403(也可以是客户端设备401或402)上传求职信息到所述服务器405,服务端405可例如通过网络获取求职信息;服务端405可例如使用标准化结构化数据服务处理所述语音录入任务,以生成结构化数据,服务端405可例如将所述结构化数据通过网络发送至用户登录的客户端设备403(也可以是客户端设备401或402)的资源位,所述资源位为所述家政行业平台平台在客户端用于展示用户的求职信息的页面。
87.服务端405可以是一个实体的服务端,还可例如为多个服务端组成,需要说明的是,本公开实施例所提供的语音录入结构化数据的方法可以由服务端405和/或客户端设备401、402、403中执行,相应地,语音录入结构化数据的系统可以设置于服务端405和/或客户端设备401、402、403 中。
88.图4是本发明的另一个实施例的客户端/服务器的结构关系图。在实施例中,所述服务器包括任务服务器与结构化数据服务器。任务服务器和结构化数据服务器可以是同一服务器,也可以是两个不同的服务器,结构化数据服务器从任务服务器加载任务,根据加载的任务从客户端获取用户录入的语音信息,将所述语音信息转化为文本信息分词、纠错生成结构化数据编辑后存储最终结构化数据。
89.在该实施例中,任务服务器和结构化数据服务器是同一服务器,服务器会获取语音录入任务,所述语音录入任务包括语音信息,获取用户录入的语音信息,将该语音信息转化为文本信息,对所述文本信息进行分词,识别分词后的文本信息中的字段及字段内容,以生成结构化数据,提供界面以向所述用户展示所述结构化数据,并接收用户输入以对所述结构化数据进行编辑,最后存储所述结构化数据。
90.当所述任务服务器与结构化数据服务器不是同一服务器,所述结构化数据服务器还用于执行:将所述结构化数据上传到任务服务器。
91.在该实施例中,任务服务器和结构化数据服务器是不同服务器,从任务服务器获取语音录入任务,所述语音录入任务包括语音信息,获取用户录入的语音信息,将该语音信息转化为文本信息,对所述文本信息进行分词,识别分词后的文本信息中的字段及字段内容,以生成结构化数据发送至结构化数据服务器,客户端提供界面以向所述用户展示所述结构化数据,任务服务器接收用户输入以对所述结构化数据进行编辑,最终结构化数据服务器存储所述结构化数据。
92.本领域技术人员应当理解,该实施例仅是示例,所述任务服务器和结构化数据服务器的架构和设定可根据用户具体设定。例如,任务服务器和结构化数据服务器可以是任务具有信息处理能力的设备,如果二者不是同一设备,则需保证二者之间能够进行通信以便进行信息交互。二者中的任何之一也可以不是一台设备,例如是基于分布式计算的云服务器实现。
93.图5是本发明的一个实施例的电子设备的结构示意图,该电子设备包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行本发明的语音录入结构化数据的方法。如前所述,本发明的电子设备可以是服务器,其用于从客户端接收录入的语音信息,同时向客户端提供结构化数据。
94.本发明的电子设备包括前述的任务服务器与展示所述结构化数据服务器的功能及其执行的方法。
95.如图5所示,电子设备以通用计算设备的形式表现。其中处理器可以是一个,也可以是多个并且协同工作。本发明也不排除进行分布式处理,即处理器可以分散在不同的实体设备中。本发明的电子设备并不限于单一实体,也可以是多个实体设备的总和。
96.所述存储器存储有计算机可执行程序,通常是机器可读的代码。所述计算机可读程序可以被所述处理器执行,以使得电子设备能够执行本发明的方法,或者方法中的至少部分步骤。
97.所述存储器包括易失性存储器,例如随机存取存储单元(ram)和/ 或高速缓存存储单元,还可以是非易失性存储器,如只读存储单元(rom)。
98.可选的,该实施例中,电子设备还包括有i/o接口,其用于电子设备与外部的设备进行数据交换。i/o接口可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
99.应当理解,图5显示的电子设备仅仅是本发明的一个示例,本发明的电子设备中还可以包括上述示例中未示出的元件或组件。例如,有些电子设备中还包括有显示屏等显示单元,有些电子设备还包括人机交互元件,例如按扭、键盘等。只要该电子设备能够执行存
储器中的计算机可读程序以实现本发明方法或方法的至少部分步骤,均可认为是本发明所涵盖的电子设备。
100.图6是本发明的一个实施例的计算机可读记录介质的示意图。如图7 所示,计算机可读记录介质中存储有计算机可执行程序,所述计算机可执行程序被执行时,实现本发明上述的语音录入结构化数据的方法。所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
101.可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如 java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
102.通过以上对实施方式的描述,本领域的技术人员易于理解,本发明可以由能够执行特定计算机程序的硬件来实现,例如本发明的系统,以及系统中包含的电子处理单元、服务器、客户端、手机、控制单元、处理器等,本发明也可以由执行本发明的方法的计算机软件来实现客户端、服务器端等执行的软件来实现。但需要说明的是,执行本发明的方法的计算机软件并不限于由一个或特定多个的硬件实体中执行,其也可以是由不特定具体硬件的以分布式的方式来实现,例如计算机程序执行的语音录入结构化数据的方法步骤可以在客户端执行。对于计算机软件,软件产品可以存储在一个计算机可读的存储介质(可以是cd

rom,u盘,移动硬盘等)中,也可以分布式存储于网络上,只要其能使得电子设备执行根据本发明的方法。
103.以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1