本发明涉及计算机技术领域,尤其涉及一种会话消息质检方法及装置。
背景技术
随着互联网的发展,人们可以基于互联网与对方在线沟通,极大地方便了各行各业的业务拓展。例如,保险行业的保险营销业务等等。
业务人员与客户通过互联网在线沟通时,是基于进行会话消息显示的会话页面实现的,即在己方的会话页面中发送并显示会话消息,使得对方的会话页面中接收并显示出相应的会话消息,进而实现业务人员与客户之间会话。
目前,为了保证业务人员进行业务拓展时并未涉及非法行为,质检人员将对业务人员与客户会话时所形成的会话消息进行人工复查,以此判断会话消息是否包含非法的关键内容,例如,理赔。
由上可知,现有的会话消息质检过程中,主要依赖于人工实现,一旦待复查的会话消息数据量过于庞大,不仅存在误检漏检的可能性,影响质检质量,而且质检效率低下。
技术实现要素:
为了解决上述技术问题,本发明的一个目的在于提供一种会话消息质检方法及装置。
其中,本发明所采用的技术方案为:
一种会话消息质检方法,包括:在进行会话消息显示的会话页面中,获取会话消息;调用质检模型对所述会话消息的质检类型进行预测,所述质检模型是根据标注了关键内容的训练样本及其质检类型训练生成的;根据预测得到的质检类型进行所述会话消息的合法性校验,如果所述会话消息非法,则对所述会话消息进行屏蔽处理。
一种会话消息质检装置,包括:会话消息获取模块,用于在进行会话消息显示的会话页面中,获取会话消息;质检类型预测模块,用于调用质检模型对所述会话消息的质检类型进行预测,所述质检模型是根据标注了关键内容的训练样本及其质检类型训练生成的;会话消息处理模块,用于根据预测得到的质检类型进行所述会话消息的合法性校验,如果所述会话消息非法,则对所述会话消息进行屏蔽处理。
在一示例性实施例中,所述会话消息处理模块包括:合法性校验单元,用于在指定质检类型库中进行指定质检类型匹配搜索,得到匹配结果;判定单元,用于如果所述匹配结果指示所述指定质检类型库中存在与所述质检类型相匹配的指定质检类型,则判定所述会话消息非法;事件拦截单元,用于当所述会话消息非法时,拦截所述会话消息对应的消息发送事件,并在所述会话页面中标识所述会话消息非法。
在一示例性实施例中,所述装置还包括:会话消息显示模块,用于如果所述匹配结果指示所述指定质检类型库中不存在与所述质检类型相匹配的指定质检类型,则触发所述消息发送事件在所述会话页面中进行所述会话消息的显示。
在一示例性实施例中,所述装置还包括:样本获取模块,用于获取标注有关键内容的训练样本及其质检类型;模型构建模块,用于根据所述训练样本及其质检类型进行指定模型结构的建模,得到神经网络模型;模型训练模块,用于对所述神经网络模型进行模型训练,生成所述质检模型。
在一示例性实施例中,所述模型构建模块包括:建模单元,用于针对不同质检类型的训练样本,分别按照所述指定模型结构进行建模,得到多个神经网络模型,每一个神经网络模型对应一种质检类型。
在一示例性实施例中,所述模型训练模块包括:参数优化单元,用于初始化所述神经网络模型的模型参数,并按照指定算法对初始化的模型参数进行更新;模型收敛单元,用于如果达到最大迭代次数或者更新的模型参数使所述神经网络模型收敛,则由所述神经网络模型收敛得到所述质检模型。
一种会话消息质检装置,包括处理器及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的会话消息质检方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的会话消息质检方法。
在上述技术方案中,从显示会话消息的会话页面中获取会话消息,调用质检模型对会话消息的质检类型进行预测,以根据预测得到的质检类型对会话消息进行合法性校验,并在会话消息非法时,对会话消息进行屏蔽处理,也就是说,业务人员与客户在线沟通时,会话消息将由质检模型进行复查,避免依赖于人工实现,提高了质检效率。
此外,对会话消息的复查与在线沟通同步执行,有效地解决了现有技术中人工质检过程滞后于业务人员与客户的沟通过程,有利于业务人员维护客户关系。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是根据本发明所涉及的实施环境在一实施例的示意图。
图2是根据本发明所涉及的实施环境在另一实施例的示意图。
图3是根据一示例性实施例示出的一种会话消息质检装置的硬件结构框图。
图4是根据一示例性实施例示出的一种会话消息质检方法的流程图。
图5是根据一示例性实施例示出的另一种会话消息质检方法的流程图。
图6是图4对应实施例中步骤350在一个实施例的流程图。
图7是图5对应实施例中步骤450在一个实施例的流程图。
图8是根据一示例性实施例示出的一种会话消息质检装置的框图。
通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述,这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相相匹配的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相相匹配的装置和方法的例子。
图1为一示例性实施例中一种会话消息质检方法所涉及的实施环境的示意图。该实施环境包括业务人员所在终端110、客户所在终端130以及用于部署会话消息质检装置200的服务端。
其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑或者其他提供会话功能的电子设备,在此不进行限定。例如,提供会话功能的电子设备可以是供即时通信客户端运行的智能手机。
业务人员所在终端110与服务端之间预先建立无线网络连接或者有线网络连接,通过所建立的连接实现终端与服务端之间的数据传输。例如,数据为待质检的会话消息。
业务人员所在终端110与客户所在终端130之间预先建立无线网络连接或者有线网络连接,通过所建立的连接实现二者之间的数据传输。例如,数据为用于实现业务人员与客户在线沟通的会话消息。
具体地,通过业务人员所在终端110与服务端交互,当业务人员与客户通过互联网在线沟通时,服务端中部署的会话消息质检装置200便会接收到业务人员所在终端110请求质检的会话消息,并对待质检的会话消息进行复查,以此判断会话消息是否非法,进而将判断结果返回至业务人员所在终端110。
对于业务人员所在终端110而言,便接收到指示了会话消息是否非法的判断结果,并在会话消息非法时,禁止该会话消息传输至客户所在终端130。
图2为一示例性实施例中一种会话消息质检方法所涉及的实施环境的示意图。该实施环境包括业务人员所在终端150和客户所在终端170,其中,会话质检装置200部署在业务人员所在终端150。
本实施例中,当业务人员与客户通过互联网在线沟通时,业务人员所在终端150获取会话消息,并对该会话消息进行复查,以此判断会话消息是否非法,如果会话消息非法,则禁止该会话消息传输至客户所在终端170。
图3是根据一示例性实施例示出的一种会话消息质检装置的硬件结构框图。需要说明的是,该会话消息质检装置只是一个适配于本发明的示例,不能认为是提供了对本发明的使用范围的任何限制。该会话消息质检装置也不能解释为需要依赖于或者必须具有图3中示出的示例性的会话消息质检装置200中的一个或者多个组件。
该会话消息质检装置200的硬件结构可因配置或者性能的不同而产生较大的差异,如图3所示,会话消息质检装置200包括:电源210、接口230、至少一存储器250、以及至少一中央处理器(cpu,centralprocessingunits)270。
其中,电源210用于为会话消息质检装置200上的各硬件设备提供工作电压。
接口230包括至少一有线或无线网络接口231、至少一串并转换接口233、至少一输入输出接口235以及至少一usb接口237等,用于与外部设备通信。
存储器250作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统251、应用程序253及数据255等,存储方式可以是短暂存储或者永久存储。其中,操作系统251用于管理与控制会话消息质检装置200上的各硬件设备以及应用程序253,以实现中央处理器270对海量数据255的计算与处理,其可以是windowsservertm、macosxtm、unixtm、linuxtm、freebsdtm等。应用程序253是基于操作系统251之上完成至少一项特定工作的计算机程序,其可以包括至少一模块(图3中未示出),每个模块都可以分别包含有对会话消息质检装置200的一系列计算机可读指令。数据255可以是存储于磁盘中的照片、图片等。
中央处理器270可以包括一个或多个以上的处理器,并设置为通过总线与存储器250通信,用于运算与处理存储器250中的海量数据255。
如上面所详细描述的,适用本发明的会话消息质检装置200将通过中央处理器270读取存储器250中存储的一系列计算机可读指令的形式来完成会话消息质检方法。
此外,通过硬件电路或者硬件电路结合软件也能同样实现本发明,因此,实现本发明并不限于任何特定硬件电路、软件以及两者的组合。
请参阅图4,在一示例性实施例中,一种会话消息质检方法适用于图1、图2中所示实施环境的会话消息质检装置,该会话消息质检装置的结构可以如图3所示。
该种会话消息质检方法可以由会话消息质检装置执行,可以包括以下步骤:
步骤310,在进行会话消息显示的会话页面中,获取会话消息。
会话页面是在电子设备中运行即时通信客户端或者社交网络客户端时,业务人员与客户进行会话的页面。
其中,即时通信客户端或者社交网络客户端可以是软件客户端或者网页客户端的形式,相应地,会话页面可以是软件客户端中显示会话消息的会话窗口,还可以是进行会话消息显示的网页页面,本实施例中并未对此加以限定。
为了实现业务人员与客户之间的会话,会话页面将为会话参与者增设会话入口,当会话参与者在该会话入口触发相应的操作,便能够获取操作相关的会话消息。
例如,会话入口为一输入对话框,当业务人员经由该输入对话框输入一定的文字或者语音时,业务人员所在终端便能够获取到与输入操作相关的文字或者语音。其中,该输入操作即为会话入口触发的相应操作,该文字或者语音即为会话消息。
由上可知,会话消息可以是文字形式,还可以是语音形式,在此不进行限定。需要说明的是,语音形式的会话消息在进行质检之前,还需要通过语音识别技术转化为文字形式的会话消息,方能够基于文字形式的会话消息执行后续的质检过程。
步骤330,调用质检模型对会话消息的质检类型进行预测。
其中,质检模型是根据标注了关键内容的训练样本及其质检类型训练生成的。
换而言之,质检模型建立了训练样本所包含关键内容与质检类型之间的映射关系,由此,便能够基于该映射关系根据会话消息所包含的关键内容进行质检类型预测。
具体地,如果会话消息所包含的关键内容与映射关系中某个关键内容极为相似甚至相匹配,则会话消息的质检类型可视为与该某个关键内容具有映射关系的质检类型相同,由此完成会话消息的质检类型预测,进而方可根据质检类型进一步地对会话消息进行合法性校验。
下面对质检模型的生成过程加以说明。
如图5所示,在一示例性实施例中,质检模型的生成过程可以包括以下步骤:
步骤410,获取标注有关键内容的训练样本及其质检类型。
训练样本,即标注了关键内容的会话消息,是质检模型的训练基础,也就是说,通过获取大量的训练样本才能够得到准确的质检模型,方可实现准确地会话消息复查。其中,关键内容可以是文字,或者包含文字的图片。
训练样本的获取中,训练样本可以来源于业务人员所在终端收集到的会话消息,还可以来自于客户所在终端收集到的会话消息,在此不进行限定。
进一步地,训练样本,被配置了质检类型,质检类型用于指示训练样本是否非法。
在一实施例的具体实现中,质检类型指示了训练样本所包含的关键内容违反的指定规则类别。例如,质检类型为1,表示训练样本所包含的关键内容违反了1类指定规则。其中,不同类别的指定规则是由质检人员根据实际的应用场景进行灵活地设定,在此并未加以限定。
更进一步地,质检类型还被用于指示训练样本包含的关键内容未违反指定规则,例如,质检类型为0,表示训练样本所包含的关键内容未违反指定规则。
应当理解,如果会话消息不同,其所包含的关键内容将有所区别,进而使得会话消息的质检类型不尽相同。
通过上述过程,分别将违反或者未违反指定规则的关键内容的训练样本作为质检模型的训练基础,确保质检模型对会话信息具有预测质检类型的能力,而且还同时能够排除未违反指定规则的关键内容的干扰,从而充分地保障了质检模型的准确性。
步骤430,根据训练样本及其质检类型进行指定模型结构的建模,得到神经网络模型。
建模,是借助指定模型所描述的指定模型结构来表征训练样本所包含关键内容与质检类型之间的映射关系。
其中,指定模型包括但不限于:神经网络模型、支持向量机模型、逻辑回归模型等等。相应地,由指定模型所描述的指定模型结构包括但不限于:双向长短期记忆网络(bidirectionallongshorttermmemory,bi-lstm)、多个长短期记忆网络(longshorttermmemory,lstm)串联、多个长短期记忆网络(longshorttermmemory,lstm)并联等等。
在一实施例的具体实现中,指定模型为神经网络模型,指定模型结构为双向长短期记忆网络(bidirectionallongshorttermmemory,bi-lstm)。
具体而言,首先,对训练样本所包含的关键内容及质检类型数字化,以生成训练样本的特征向量。也可以理解为,训练样本的特征向量是以数字的形式唯一地表征训练样本所包含的关键内容及质检类型,即实现了对训练样本所包含的关键内容及质检类型的准确描述。
然后,利用指定模型所描述的指定模型结构来表征训练样本的特征向量,以此得到神经网络模型。
步骤450,对神经网络模型进行模型训练,生成质检模型。
其中,模型训练即是对神经网络模型的模型参数进行迭代更新,以使训练样本所包含关键内容与质检类型之间的映射关系达到最优。通过上述实现过程,质检模型即是在训练样本所包含关键内容与质检类型之间构建了最优的映射关系,以便于后续能够由会话信息中的关键内容预测得到相应的质检类型,进而根据质检类型判断会话消息所包含的关键内容是否非法。
步骤350,根据预测得到的质检类型进行会话消息的合法性校验,如果会话消息非法,则对会话消息进行屏蔽处理。
合法性校验,是指根据预测得到的质检类型判断会话消息是否非法,即会话消息是否包含违反指定规则的关键内容。
例如,由于质检类型指示了训练样本所包含的关键内容违反的指定规则类别,因此,假设预测得到的质检类型为1,即指示会话消息包含的关键内容违反了1类指定规则,由此,便判定会话消息非法。
基于此,通过合法性校验,便能够判断会话消息是否非法,进而对会话消息进行相应处理。
具体地,如果会话消息非法,即包含违反指定规则的关键内容,则对会话消息进行屏蔽处理,即不执行会话消息的发送。
反之,如果会话消息合法,即未包含违反指定规则的关键内容,则发送会话消息,进而方可在会话页面中显示该会话消息,实现会话参与者之间的会话。
通过如上所述的过程,实现了会话消息的自动复查,避免依赖于人工实现,提高了质检效率。
请参阅图6,在一示例性实施例中,步骤350可以包括以下步骤:
步骤351,根据质检类型在指定质检类型库中进行指定质检类型匹配搜索,得到匹配结果。
其中,匹配结果指示了指定质检类型库中是否存在与质检类型相匹配的指定质检类型。
指定质检类型库,是由指定质检类型存储形成的。其中,指定质检类型是根据质检人员所设定的指定规则而配置的,例如,为1类指定规则配置的指定质检类型为1。
也就是说,指定质检类型表示关键内容所违反的指定规则。
由此,如果在指定质检类型库中搜索到与质检类型相匹配的指定质检类型,即说明预测得到该质检类型的会话消息包含违反指定规则的关键内容,则判定会话消息非法,进而跳转执行步骤355。
反之,如果在指定质检类型库中未搜索到与质检类型相匹配的指定质检类型,即说明预测得到该质检类型的会话消息并不包含违反指定规则的关键内容,则判定会话消息合法,进而跳转执行步骤357。
步骤353,如果匹配结果指示指定质检类型库中存在与质检类型相匹配的指定质检类型,则判定会话消息非法。
步骤355,当会话消息非法时,拦截会话消息对应的消息发送事件,并在会话页面中标识会话消息非法。
消息发送事件,是用于将会话消息发送至会话页面中进行显示的子线程。
为此,通过拦截非法的会话消息所对应的消息发送事件,便能够阻止非法的会话消息在会话页面中进行显示。
进一步地,为了对发起非法的会话消息的会话参与者给予警告,将在会话页面中进行非法会话消息的标识。
标识,指的是通过用户界面元素(ui)对会话消息非法进行标记。例如,在会话页面中,显示出告警图标,该告警图标即为用于标记会话消息非法的用户界面元素。
在一示例性实施例中,如图6所示,步骤351之后,如上所述的方法还可以包括以下步骤:
步骤357,如果匹配结果指示指定质检类型库中不存在与质检类型相匹配的指定质检类型,则触发消息发送事件在会话页面中进行会话消息的显示。
如果会话消息合法,便通过触发合法的会话消息所对应的消息发送事件,将合法的会话消息显示在会话页面中。
在上述实施例的配合下,实现了会话消息的自动复查与在线沟通同步执行,即通过合法性校验的会话消息将实时显示在会话页面中,以便于会话参与者之间进行会话,而未通过合法性校验的会话消息则禁止在会话页面中进行显示,以此阻止会话参与者之间的会话,由此达到会话消息质检的目的,不仅实时性高,而且准确性也极高。
在一示例性实施例中,步骤430可以包括以下步骤:
针对不同质检类型的训练样本,分别按照指定模型结构进行建模,得到多个神经网络模型。
其中,每一个神经网络模型对应一种质检类型。
如前所述,神经网络模型,实质上是利用指定模型所描述的指定模型结构来表征训练样本的特征向量,而特征向量是对训练样本所包含的关键内容及质检类型的准确描述。
应当理解,由于质检类型与质检人员所设定的指定规则息息相关,如果质检人员设定的指定规则较为复杂,必然造成训练样本的质检类型过于庞杂,进而增加了训练样本的特征向量随机性,必然增加建模的复杂度。
为此,本实施例中,神经网络模型的生成,是针对不同质检类型的训练样本进行的,由此,方可降低特征向量的随机性,即针对同一质检类型的训练样本,质检类型保持不变,进而降低建模的复杂度。
请参阅图7,在一示例性实施例中,步骤450可以包括以下步骤:
步骤451,初始化神经网络模型的模型参数,并按照指定算法对初始化的模型参数进行迭代更新。
如前所述,模型训练是为了使训练样本所包含的关键内容与质检类型之间的映射关系达到最优。
基于此,对神经网络模型的模型参数执行随机初始化,按照指定算法判断上述映射关系是否达到最优。
如果映射关系未达到最优,则更新神经网络模型的模型参数,并继续按照指定算法判断上述映射关系是否达到最优。
反之,如果映射关系达到最优或者迭代次数达到最大,则停止迭代,并跳转执行步骤453。
其中,指定算法包括但不限于:最大期望算法、余弦损失函数等等。
步骤453,如果达到最大迭代次数或者更新的模型参数使神经网络模型收敛,则由神经网络模型收敛得到质检模型。
衡量更新的模型参数使得神经网络模型收敛,是基于指定算法进行的。例如,当更新的模型参数使得余弦损失函数的损失最小,则更新的模型参数使得神经网络模型收敛为质检模型。
通过上述实施例的配合,实现了质检模型的生成,进而实现了对会话消息质检类型的预测能力,有效地提高质检能力。
在一应用场景中,基于上述质检模型,当业务人员与客户在线沟通时,只要获得二者之间会话时所产生的会话消息,便能够输入至质检模型进行质检类型的预测,进而得到会话消息的质检类型,并由质检类型来确定会话消息是否合法,不仅提高了质检效率,还有效地提升了质检能力。
下述为本发明装置实施例,可以用于执行本发明所涉及的会话消息质检方法。对于本发明装置实施例中未披露的细节,请参照本发明所涉及的会话消息质检方法的方法实施例。
请参阅图8,在一示例性实施例中,一种会话消息质检装置900包括但不限于:会话消息获取模块910、质检类型预测模块930和会话消息处理模块950。
其中,会话消息获取模块910用于在进行会话消息显示的会话页面中,获取会话消息。
质检类型预测模块930用于调用质检模型对会话消息的质检类型进行预测,质检模型是根据标注了关键内容的训练样本及其质检类型训练生成的。
会话消息处理模块950用于根据预测得到的质检类型进行会话消息的合法性校验,如果会话消息非法,则对会话消息进行屏蔽处理。
需要说明的是,上述实施例所提供的会话消息质检装置在进行会话消息质检处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即会话消息质检装置的内部结构将划分为不同的功能模块,以完成以上描述的全部或者部分功能。
另外,上述实施例所提供的会话消息质检装置与会话消息质检方法的实施例属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
在一示例性实施例中,一种会话消息质检装置,包括处理器及存储器。
其中,存储器上存储有计算机可读指令,该计算机可读指令被处理器执行时实现上述各实施例中的会话消息质检方法。
在一示例性实施例中,一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各实施例中的会话消息质检方法。
上述内容,仅为本发明的较佳示例性实施例,并非用于限制本发明的实施方案,本领域普通技术人员根据本发明的主要构思和精神,可以十分方便地进行相应的变通或修改,故本发明的保护范围应以权利要求书所要求的保护范围为准。