应用于客服终端的交互方法和系统与流程

文档序号：29460055发布日期：2022-04-02 00:57阅读：102来源：国知局

1.本公开涉及轨道交通技术领域，尤其涉及应用于客服终端的交互方法和系统。

背景技术：

2.随着城市的发展，轨道交通在人的出行过程中扮演着越来越重要的角色，而人们在乘坐地铁的过程中难免会遇到各种各样的问题，例如票卡异常、信息问询、寻找遗失物品等，地铁运营方解决乘客服务方面的负担越来越重。无人客服终端可以解决乘客大部分的信息咨询、票卡异常、失物招领等方面的问题，有效减少地铁车站运营人员的重复性劳动。
3.但是对于特殊乘客，如听障人士和阅读障碍人群，难以使用触摸交互，因此，无人客服终端也难以有效为特殊乘客提供咨询服务，从而降低运营效率，影响用户体验。

技术实现要素：

4.为解决现有技术中存在的上述技术问题，本公开实施例提供了一种应用于客服终端的交互方法和系统。
5.根据本公开的第一方面，提供了一种应用于客服终端的交互方法，包括：
6.响应于在预设时间段内重复检测到目标用户的人脸位于交互区域时，提取所述目标用户的人体轮廓特征；
7.对所述目标用户进行锁定跟踪，根据所述人体轮廓特征，确定感兴趣区域，其中，所述感兴趣区域包括手部区域；
8.按照第一预设时间间隔提取所述手部区域内的目标用户的手势图像帧，对所述手势图像帧进行识别，生成识别结果；
9.根据所述识别结果，发送反馈信息。
10.在一些实施例中，所述在预设时间段内重复检测到目标用户的人脸位于交互区域，包括：
11.当在所述交互区域内第一次检测到人脸图像时，开始计时；
12.当在预设时间段内按照预设时间间隔再次在所述交互区域内检测到所述人脸图像时，确定在预设时间段内重复检测到目标用户的人脸位于交互区域。
13.在一些实施例中，所述提取所述目标用户的人体轮廓特征，包括：
14.通过hog特征结合svm分类器对所述目标用户的人体轮廓特征进行提取，屏蔽所述人体轮廓特征以外的图像区域。
15.在一些实施例中，所述通过hog特征结合svm分类器对所述目标用户的人体轮廓特征进行提取，包括：
16.对交互区域内的图像进行灰度化和归一化处理，生成灰度图像；
17.对所述灰度图像中的每个像素点计算水平梯度和垂直梯度，进而计算对应的梯度幅值和梯度方向；
18.根据所述梯度幅值和所述梯度方向确定所述灰度图像的特征向量；
19.利用预先训练的svm分类器对所述特征向量进行识别，提取所述目标用户的人体轮廓特征。
20.在一些实施例中，还包括：
21.采用三帧差分法和轮廓特征提取算法对所述目标用于的人体进行追踪，识别人体轮廓特征点的移动方向和距离，对所述目标用户进行跟踪，动态生成感兴趣区域。
22.在一些实施例中，所述感兴趣区域还包括嘴部区域，所述方法还包括：
23.对所述嘴部区域的特征进行识别，响应于检测到嘴唇动作，记录起始时间和第一偏移时间，其中，所述第一偏移时间为嘴唇动作的检测时间；
24.响应于检测到嘴唇动作停止，记录终止时间和第二偏移时间，其中，所述第二偏移时间为嘴唇动作停止的检测时间；
25.根据所述记录起始时间、所述第一偏移时间、所述终止时间和所述第二偏移时间截取录音；
26.根据后台服务器对截取的录音进行识别的结果，输出答复信息。
27.在一些实施例中，所述根据所述识别结果，发送反馈信息，包括：
28.根据所述识别结果，发送对应的语音信息和/或在交互界面显示对应的内容。
29.根据本公开的第二方面，提供了一种应用于客服终端的交互系统，包括：
30.人体轮廓特征提取模块，用于响应于在预设时间段内重复检测到目标用户的人脸位于交互区域时，提取所述目标用户的人体轮廓特征；
31.感兴趣区域确定模块，用于对所述目标用户进行锁定跟踪，根据所述人体轮廓特征，确定感兴趣区域，其中，所述感兴趣区域包括手部区域；
32.识别结果生成模块，用于按照第一预设时间间隔提取所述手部区域内的目标用户的手势图像帧，对所述手势图像帧进行识别，生成识别结果；
33.信息反馈模块，用于根据所述识别结果，发送反馈信息。
34.根据本公开的第三方面，提供了一种电子设备。该电子设备包括：存储器和处理器，所述存储器上存储有计算机程序，所述处理器执行所述程序时实现如以上第一方面所述的方法。
35.根据本公开的第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如以上第一方面所述的方法。
36.应当理解，发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征，亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
37.本公开实施例的应用于客服终端的交互方法，能够有效为特殊乘客提供咨询服务，提高运营效率，进而提高用户体验。
附图说明
38.结合附图并参考以下详细说明，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。附图用于更好地理解本方案，不构成对本公开的限定在附图中，相同或相似的附图标记表示相同或相似的元素，其中：
39.图1示出了根据本公开的实施例的应用于客服终端的交互方法的流程图；
40.图2示出了根据本公开的实施例的应用于客服终端的交互系统的框图；
41.图3示出了能够实施本公开的实施例的示例性电子设备的方框图；
42.图4示出了本公开的实施例的应用于客服终端的交互系统的结构示意图。
具体实施方式
43.为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例，都属于本公开保护的范围。
44.另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。
45.本公开实施例的应用于客服终端的交互方法，能够替代和减少地铁站站务人员的重复性劳动，降低人工成本，为乘客提供丰富的信息，提高乘客出行满意度，并且不仅能够为正常乘客提供咨询信息，同时还能为特殊乘客提供咨询服务，从而提高运营效率，提高用户体验。
46.具体地，如图1所示，为本公开的实施例的应用于客服终端的交互方法的流程图。本实施例的应用于客服终端的交互方法，可以包括以下步骤：
47.s101：响应于在预设时间段内重复检测到目标用户的人脸位于交互区域时，提取所述目标用户的人体轮廓特征。
48.s102：对所述目标用户进行锁定跟踪，根据所述人体轮廓特征，确定感兴趣区域，其中，所述感兴趣区域包括手部区域。
49.s103：按照第一预设时间间隔提取所述手部区域内的目标用户的手势图像帧，对所述手势图像帧进行识别，生成识别结果。
50.s104：根据所述识别结果，发送反馈信息。
51.具体地，本公开实施例的方法可以应用于轨道交通系统，具体地，可以应用于轨道交通系统的无人交互系统。如图4所示，为本公开的实施例的应用于客服终端的交互系统的结构示意图。无人交互系统包括边缘计算模块，以及与边缘计算模块连接的摄像头、触摸屏、扬声器和语音识别模块，所述边缘计算模块与云端智能客服平台连接，其中，语音识别模块与拾音器连接。在一些实施例中，边缘计算模块、摄像头、触摸屏、扬声器和语音识别模块，以及与语音识别模块连接的拾音器可以集成在客服终端上，用于为乘客提供咨询服务。关于为正常乘客提供咨询服务的过程和原理可以参见现有技术中的客服终端，本公开实施例不再详细赘述。本公开实施例针对如何为特殊乘客(例如听障人士和阅读障碍人群)提供咨询服务进行说明。
52.首先，通过摄像头可以采集交互区域内的图像信息，并在预设时间段内重复检测到目标用户的人脸位于交互区域时，对所述目标用户的人脸位置进行锁定，并提取所述目标用户的人体轮廓特征。
53.具体地，当在所述交互区域内第一次检测到人脸图像时，开始计时；当在经过预设时间段后再次在所述交互区域内检测到所述人脸图像时，确定在预设时间段内重复检测到
目标用户的人脸位于交互区域，此时，对目标用户进行锁定，并提取所述目标用户的人体轮廓特征。这样，可以避免乘客路过所述交互区域或者由于其他原因短暂进入交互区域而又并非需要进行服务咨询时，然后进行后续程序的情况，从而提高运营效率。
54.当在预设时间段内重复检测到目标用户的人脸位于交互区域时，可以判定该用户是要进行咨询的目标用户，此时，对所述目标用户的人脸位置进行锁定，并提取所述目标用户的人体轮廓特征。
55.在本实施例中，通过hog特征结合svm分类器对所述目标用户的人体轮廓特征进行提取，屏蔽所述人体轮廓特征以外的图像区域。具体地，可以对交互区域内的图像进行灰度化和归一化处理，生成灰度图像；对所述灰度图像中的每个像素点计算水平梯度和垂直梯度，进而计算对应的梯度幅值和梯度方向；根据所述梯度幅值和所述梯度方向确定所述灰度图像的特征向量；利用预先训练的svm分类器对所述特征向量进行识别，提取所述目标用户的人体轮廓特征。gx(x，y)＝h(x+1，y)-h(x-1，y)，
56.例如，对图像进行灰度化和归一化处理之后，对图像中的每个像素点计算水平梯度和垂直梯度，水平梯度公式为：gx(x，y)＝h(x+1，y)-h(x-1，y)，垂直方向梯度公式为gy(x，y)＝h(x，y+1)-h(x，y-1)。其中gx(x，y)，gy(x，y)，h(x，y)分别表示像素点(x，y)处的水平梯度，垂直梯度和像素值。计算像素点(x，y)处的梯度幅值和梯度方向，梯度幅值公式为：
[0057][0058][0059]
其中，g(x，y)为梯度幅值，
∝
(x，y)为梯度方向，梯度方向取绝对值，方向在0——180度之间。将方向分为9个区间，20度一个区间。
[0060]
把图像以8*8个像素为一个单元(cell)分割为若干个像素的单元(cell)，计算单元里每一个像素点的梯度，把梯度方向平均划分为9个区间(bin)，在每个单元里面对所有像素的梯度方向在各个方向区间进行直方图统计，每相邻的4个单元构成一个块(block)，把一个块内的特征向量联起来得到36维的特征向量。计算图像中所有块的特征向量，得到图像的所有特征向量。将图像的所有特征向量输入到预先训练的svm分类器，提取人体轮廓。其中，svm分类器是通过将图像的每一个块作为一个样本，手动标注所有特征向量，将包含人体轮廓的特征向量作为正样本，不包含人体轮廓的向量作为负样本。然后对预先创建的分类器模型进行训练，生成的svm分类器。
[0061]
在提取人体轮廓后，根据人体轮廓特征，确定感兴趣区域，其中，所述感兴趣区域包括手部区域和嘴部区域。本实施例中的感兴趣区域是用来图像识别的区域。在本实施例中，由于是为特殊乘客提供咨询服务，因此可以仅识别手部区域。具体地，可以在交互过程中对所述目标用户进行跟踪。本公开实施例采用三帧差分法和轮廓特征提取算法对目标用户进行跟踪，识别人体特征点移动方向和距离，跟踪乘客的身体移动，动态生成感兴趣区域，排除复杂背景对手语手势识别的干扰c
[0062]
三帧差分法的算法描述如下：
[0063]
fn为第n帧图像，fn(x，y)第n帧图像的(x，y)点的像素值，fn与fn-1的帧间差分为：
[0064]
dn＝|fn(x，y)-fn-1(x，y)|，，fn+1与fn的帧间差分为dn+1＝|fn+1(x，y)-fn(x，y)|。三帧之间的帧间差为：
[0065]
dn＝dn∩dn+1。通过如上计算后，dn即为运动目标所在的位置。
[0066]
基于以上算法，系统识别乘客手势消除背景干扰的工作流程如下：
[0067]
1)摄像头识别到人脸，开始计时
[0068]
2)2秒后，人脸依然在摄像头前，转到3)，人脸离开，返回1)。
[0069]
3)人体轮廓识别，特征锁定，获取感兴趣区域。
[0070]
4)手语识别，同时跟踪人体移动，移动感兴趣区域。
[0071]
5)人体轮廓离开摄像头视野区域，返回1)，人体轮廓依然在摄像头视野区域，返回4)循环。
[0072]
在跟踪目标用户移动的过程中，对目标用户的手势进行识别，确定目标用户所要表达的内容，针对目标用户所要表达的内容进行答复，例如，通过语音播报的形式进行答复，或者通过交互界面变换的形式进行答复。
[0073]
本公开实施例的应用于客服终端的交互方法，能够为特殊乘客提供咨询服务，从而提高运营效率，提高用户体验。
[0074]
此外，作为本公开的一个可选实施例，上述实施例中的方法还可以应用于为正常乘客提供咨询服务。具体地，当为正常乘客提供咨询服务时，在人体轮廓识别，特征锁定，获取感兴趣区域时，获取的是嘴部区域，对所述嘴部区域的特征进行识别，响应于检测到嘴唇动作，记录起始时间和第一偏移时间，其中，所述第一偏移时间为嘴唇动作的检测时间；响应于检测到嘴唇动作停止，记录终止时间和第二偏移时间，其中，所述第二偏移时间为嘴唇动作停止的检测时间；根据所述记录起始时间、所述第一偏移时间、所述终止时间和所述第二偏移时间截取录音；将截取的录音发送至后台服务器，后台服务器对截取的录音进行识别后在发送至前端，由前端根据识别结果输出答复信息。具体地，在截取录音后，可以进行语音识别，转换为文字，然后传输给云端无人客服，通过nlp语义理解，输出答复。
[0075]
本实施例的方法，能够为乘客提供咨询服务，从而提高运营效率，提高用户体验。
[0076]
需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本公开并不受所描述的动作顺序的限制，因为依据本公开，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本公开所必须的。
[0077]
以上是关于方法实施例的介绍，以下通过装置实施例，对本公开所述方案进行进一步说明。
[0078]
如图2所示，为本公开的实施例的应用于客服终端的交互系统的框图。本实施例的应用于客服终端的交互系统，包括：
[0079]
人体轮廓特征提取模块201，用于响应于在预设时间段内重复检测到目标用户的人脸位于交互区域时，提取所述目标用户的人体轮廓特征。
[0080]
感兴趣区域确定模块202，用于对所述目标用户进行锁定跟踪，根据所述人体轮廓特征，确定感兴趣区域，其中，所述感兴趣区域包括手部区域。
[0081]
识别结果生成模块203，用于按照第一预设时间间隔提取所述手部区域内的目标用户的手势图像帧，对所述手势图像帧进行识别，生成识别结果。
[0082]
信息反馈模块204，用于根据所述识别结果，发送反馈信息。
[0083]
所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，所述描述的模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
[0084]
根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0085]
图3示出了可以用来实施本公开的实施例方法的电子设备300的示意性框图。如图所示，设备300包括中央处理单元(cpu)301，其可以根据存储在只读存储器(rom)302中的计算机程序指令或者从存储单元308加载到随机访问存储器(ram)303中的计算机程序指令，来执行各种适当的动作和处理。在ram 303中，还可以存储设备300操作所需的各种程序和数据。cpu 301、rom 302以及ram 303通过总线304彼此相连。输入/输出(i/o)接口305也连接至总线304。
[0086]
设备300中的多个部件连接至i/o接口305，包括：输入单元306，例如键盘、鼠标等；输出单元307，例如各种类型的显示器、扬声器等；存储单元308，例如磁盘、光盘等；以及通信单元309，例如网卡、调制解调器、无线通信收发机等。通信单元309允许设备300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0087]
处理单元301执行上文所描述的各个方法和处理，其被有形地包含于机器可读介质，例如存储单元308。在一些实施例中，计算机程序的部分或者全部可以经由rom 302和/或通信单元309而被载入和/或安装到设备300上。当计算机程序加载到ram 703并由cpu 301执行时，可以执行上文描述的方法的一个或多个步骤。备选地，在其他实施例中，cpu 301可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行上述方法。
[0088]
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)等等。
[0089]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0090]
在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0091]
此外，虽然采用特定次序描绘了各操作，但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行，或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具
体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地，在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
[0092]
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高召松王任文包峰
技术所有人：交控科技股份有限公司
我是此专利的发明人

上一篇：语音合成系统、方法、装置及设备与流程
上一篇：一种毛笔制造用毛料切割机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。