本说明书涉及数据处理技术领域,尤其涉及一种投诉举报类别的排序方法和装置。
背景技术:
对任何一个企业而言,客户服务都是至关重要的。随着互联网的发展和智能终端的普及,越来越多的企业提供更加方便和高效的网上客户服务,在提高服务效率的同时降低服务成本。作为客户服务的一个组成部分,接收用户的投诉举报并及时解决用户的问题,能够增进客户关系和增加用户的满意度。
企业通常会在各种能够接触用户的网络场景中提供投诉举报入口,如企业网站、企业的客户端app(应用程序)中。用户在进入投诉举报入口后,通常需要选择自己投诉举报的问题属于哪个类别。由于不同类别的投诉举报往往有不同的后续处理流程,能否准确选择投诉举报类别不仅对投诉举报的处理效率,而且对投诉举报数据的收集和利用都有重要的影响。
技术实现要素:
有鉴于此,本说明书提供一种投诉举报类别的排序方法,包括:
在收到用户的投诉举报请求后,获取所述用户的行为记录和个人信息;
将所述用户的行为记录和个人信息输入个性化模型,得到每个投诉举报类别的个性化评估值;所述个性化模型为有监督学习的分类模型,采用标记有投诉举报类别的用户行为记录和个人信息样本进行训练;
根据所述个性化评估值确定所述用户的投诉举报类别的排列次序。
本说明书还提供了一种投诉举报类别的排序装置,包括:
输入特征获取单元,用于在收到用户的投诉举报请求后,获取所述用户的行为记录和个人信息;
个性化评估单元,用于将所述用户的行为记录和个人信息输入个性化模型,得到每个投诉举报类别的个性化评估值;所述个性化模型为有监督学习的分类模型,采用标记有投诉举报类别的用户行为记录和个人信息样本进行训练;
排序确定单元,用于根据所述个性化评估值确定所述用户的投诉举报类别的排列次序。
本说明书提供的一种计算机设备,包括:存储器和处理器;所述存储器上存储有可由处理器运行的计算机程序;所述处理器运行所述计算机程序时,执行上述投诉举报类别的排序方法所述的步骤。
本说明书提供的一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,执行上述投诉举报类别的排序方法所述的步骤。
由以上技术方案可见,本说明书的实施例中,以发起投诉举报请求的用户的行为记录和个人信息作为个性化模型的输入,得到每个投诉举报类别的个性化评估值,并按照个性化评估值决定该用户投诉举报类别的排列次序,从而提高了该用户选择正确的投诉举报类别的概率,不仅能够加快对投诉举报的处理速度,提高用户的满意程度,而且使得各个类别的投诉举报数据更加准确,有利于得出更精准的数据挖掘结果。
附图说明
图1是本说明书实施例中一种投诉举报类别的排序方法的流程图;
图2是本说明书应用示例中一种举报类别的排序方式示意图;
图3是运行本说明书实施例的设备的一种硬件结构图;
图4是本说明书实施例中一种投诉举报类别的排序装置的逻辑结构图。
具体实施方式
绝大多数用户在使用投诉举报功能时,通常处于较为迫切的状态,急于提交自己的问题。在选择投诉举报分类时,往往会在看到第一个近似于自己问题的类别时就做出选择,很难做到在看完所有类别后再选择最优的一个。投诉举报类别的排列次序对用户的选择准确性有非常大的影响。
因此,本说明书的实施例提出一种新的投诉举报类别的排序方法,采用以用户的行为记录和个人信息样本训练完成的个性化模型,以发出投诉举报请求的用户的行为记录和个人信息为输入,得到每个投诉举报类别对该用户的个性化评估值,作为投诉举报类别排序的依据,从而使得投诉举报类别的排序更加符合用户的实际情况,用户有更高的概率选择正确的类别,提高了投诉举报的处理效率,同时企业也能够得到更准确的投诉举报分类数据,为数据挖掘提供了更好的基础。
本说明书的实施例可以运行在任何具有计算和存储能力的设备上,如手机、平板电脑、pc(personalcomputer,个人电脑)、笔记本、服务器等设备;还可以由运行在两个或两个以上设备的逻辑节点来实现本说明书实施例中的各项功能。
本说明书的实施例中,投诉举报包括各种用户向网络服务提供方进行负面反馈的行为,例如向网络服务提供方提出负面意见、提交负面信息、提出需要网络服务提供方配合来解决的问题等等,不做限定。
由于投诉举报行为通常是由之前发生的网络事件导致,用户在投诉举报前在网络上的行为往往与投诉举报类别有较大的关联度;另外,反映用户个体特性的一些个人信息也与投诉举报类别相关联。因此,本说明书的实施例中,采用用户的行为记录和个人信息建立有监督学习的分类模型,本说明书中称之为个性化模型,来预测一个用户可能进行哪个类别的投诉举报。个性化模型以用户的行为记录和个人信息作为输入,以投诉举报类别的个性化评估值作为输出。作为有监督学习模型,个性化模型采用标记了最终用户实际进行投诉举报的类别的用户行为记录和个人信息样本进行训练。
其中,用户的行为记录可以包括用户在请求进行投诉举报前某个时间段内的任何网络行为记录,例如可以是用户的浏览记录、用户的聊天记录、用户的功能使用记录中的一项到多项。用户的行为记录可以是用户在某个或某几个网站或客户端应用程序中的行为记录,也可以是用户在某个终端或以某个账户进行的行为的记录,不做限定。
用户的个人信息可以包括任何能够反映用户的个体特性的信息,例如用户的地理位置信息、反映用户偏好的个性标签、用户的ip地址等中的一项到多项。
假设n(n为大于等于2的自然数)为投诉举报类别的个数,个性化分类模型可以是一个多分类模型,其输出为对n个投诉举报类别的个性化评估值;也可以采用n个二分类模型来分别预测每个投诉举报类别,即每个二分类模型对应于一个投诉举报类别,其输出为对该投诉举报类别的个性化评估值。
此外,本说明书实施例中对个性化模型所采用的分类算法没有限制,例如个性化模型可以是随机森林算法模型,可以是gbdt(gradientboostingdecisiontree,梯度提升决策树)算法模型,可以是xgboost(extremegradientboosting,高效梯度提升)算法模型,还可以是其他分类算法模型。
本说明书的实施例中,投诉举报类别的排序方法的流程如图1所示。
步骤110,在收到用户的投诉举报请求后,获取所述用户的行为记录和个人信息。
通常用户在登录后,可以通过网络服务提供方设置的投诉举报入口来发起投诉举报请求,例如,可以是在网络服务提供方的网站上打开进行投诉举报的页面,在网络服务提供方的客户端应用程序中点击投诉举报按钮等,网络服务提供方的服务端将收到由用户所使用的终端发出的投诉举报请求。
网络服务提供方在收到投诉举报请求后,根据实际应用场景中服务端的具体实现以及行为记录和个人信息的具体内容,可以从保存用户行为记录和/或个人信息的预定网络位置、预定数据库表等处读取到用户的行为记录和/或个人信息,也可以向维护用户行为记录和/或个人信息的其他服务器请求并从回复中得到用户的行为记录和/或个人信息,不做限定。
步骤120,将用户的行为记录和个人信息输入个性化模型,得到每个投诉举报类别的个性化评估值。
对多分类的个性化模型,将用户的行为记录和个人信息输入到多分类模型中,即可得到n个投诉举报类别的个性化评估值。对n个二分类的个性化模型,分别将用户的行为记录和个人信息输入到n个二分类模型中,每个二分类输出对应于该二分类模型的投诉举报类别的个性化评估值。
步骤130,根据个性化评估值确定该用户的投诉举报类别的排列次序。
网络服务提供方按照某个用户的各个投诉举报类别的个性化评估值,来决定对于该用户的投诉举报类别的排列次序,并返回给发起投诉举报请求的用户的终端。用户的终端将投诉举报类别按照返回的排列次序显示给用户,供用户选择。将用户更有可能进行的投诉举报类别排列在前,将极大的增加用户做出正确分类选择的概率。
除个性化评估值外,还可以综合考虑其他因素来确定对于某个用户的投诉举报类别的排序。以下举例说明。
第一个例子:有的类别的投诉举报会在一定的时间段呈现爆发性增长,例如春节前机票、车票的诈骗举报、假期兼职被骗的举报。在这样的例子中,可以按照第一预定时间段内每个投诉举报类别的发生次数,确定投诉举报类别的全局评估结果;然后根据全局评估结果和某个用户的投诉举报类别的个性化评估值,来确定该用户的投诉举报类别排序。
第二个例子:不同类别的投诉举报可能在不同地区具有不同的发生概率,例如在一些偏远地区,发生的投诉举报类别较为单一和集中。在这样的例子中,可以按照第二预定时间段内每个投诉举报类别在某个用户所在地域的发生次数,确定投诉举报类别的区域评估结果;然后根据区域评估结果和该用户的投诉举报类别的个性化评估值,来确定该用户的投诉举报类别排序。
上述两个例子中,可以根据实际应用场景的具体情况、全局评估结果和/或区域评估结果对投诉举报类别排序的影响等因素,来决定具体的排序方法,本说明书的实施例不做限定。例如,可以根据各个投诉举报类别的发生次数在全局评估结果和/或区域评估结果中设定不同的分值,对某个投诉举报类别,将在全局评估结果和/或区域评估结果中的分值、与个性化评估值的加权和作为该投诉举报类别的最终评估值,并按照最终评估值来对投诉举报类别排序。
另外,上述两个例子中的全局评估结果和区域评估结果可以结合使用。以下给出结合使用的第三个例子:将第一预定时间段内发生次数最多的p(p为小于n的自然数)个投诉举报类别,作为全局类别;将除p个全局类别外,在第二预定时间段内发生次数最多的q(q为不大于(n-p)的自然数)个投诉举报类别,作为区域类别;在确定投诉举报类别的排序时,将p个全局类别按发生次数降序排列,之后将q个区域类别按发生次数降序排列,之后按照个性化评估值排列除全局类别和区域类别外剩余的(n-p-q)个投诉举报类别。在这个例子中,最优先排列p个全局类别,然后排列q个区域类别,之后是按照个性化评估值排列的其他投诉举报类别。
可见,本说明书的实施例中,采用以用户的行为记录和个人信息样本训练完成的个性化模型,以发起投诉举报请求的用户的行为记录和个人信息作为个性化模型的输入,得到每个投诉举报类别对该用户的个性化评估值,作为投诉举报类别排序的依据,使得投诉举报类别的排序更加符合用户的实际情况,提高了该用户选择正确的投诉举报类别的概率,加快了对投诉举报的处理速度,能够提高用户的满意程度,同时使得各个类别的投诉举报数据更加准确,为数据挖掘提供了更好的基础。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本说明书的一个应用示例中,第三方移动支付平台在其客户端app中为用户提供了举报入口,以便通过用户的举报及时发现和制止非法行为,保护用户的资金安全。用户在app中点击举报按钮后,可以在打开的类型选择页面上选择举报类型,来进行该类型事项的举报。举报类型包括兼职被骗、刷单、色情、赌博、理财被骗、交易被骗等。
在第三方移动支付平台的服务端,以用户24小时内在客户端app中的浏览记录和聊天记录作为用户的行为记录,以用户的个性标签(如网购达人、电影迷、健身狂人等)、用户的ip地址、用户的地理位置信息作为用户的个人信息,建立有多分类个性化模型,并采用标记了用户举报应属类别的样本数据进行训练。
在用户点击举报按钮后,app将用户的举报请求发送给服务端。服务端从用户数据库中读取该用户的个性标签,根据与客户端app的交互得到用户终端的ip地址、以及终端所在的地理位置信息。服务端从用户行为数据库中查询该用户在过去24小时内在app内的浏览记录和聊天记录。将用户的个性标签、ip地址、地理位置信息、浏览记录和聊天记录输入到多分类个性化模型中,得到每个举报类别的个性化评估值。
服务端统计过去一周所有用户在每个类别的举报,将举报次数最多的一个类别作为全局类别。基于用户的地理位置信息,服务端统计过去一周在该用户所在区域(包括城市、城镇、郊区、或乡村等)发生的每个类别的举报次数,将除全局类别外举报次数最多的一个类别作为区域类别。服务端将全局类别作为第一项,将区域类别作为第二项,对除全局类别和区域类别外的其他举报类别,按照个性化评估值从可能性高到可能性低将其他举报类别从第三项开始依次排序,如图2所示。服务端将举报类别及其排序返回给app,由app展示给用户。用户在打开的类型选择页面上看到按照上述顺序排列的举报类别。
与上述流程实现对应,本说明书的实施例还提供了一种投诉举报类别的排序装置。该装置可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为逻辑意义上的装置,是通过所在设备的cpu(centralprocessunit,中央处理器)将对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,除了图3所示的cpu、内存以及存储器之外,投诉举报类别的排序装置所在的设备通常还包括用于进行无线信号收发的芯片等其他硬件,和/或用于实现网络通信功能的板卡等其他硬件。
图4所示为本说明书实施例提供的一种投诉举报类别的排序装置,包括输入特征获取单元、个性化评估单元和排序确定单元,其中:输入特征获取单元用于在收到用户的投诉举报请求后,获取所述用户的行为记录和个人信息;个性化评估单元用于将所述用户的行为记录和个人信息输入个性化模型,得到每个投诉举报类别的个性化评估值;所述个性化模型为有监督学习的分类模型,采用标记有投诉举报类别的用户行为记录和个人信息样本进行训练;排序确定单元用于根据所述个性化评估值确定所述用户的投诉举报类别的排列次序。
可选的,所述个性化模型包括多分类模型或n个二分类模型,n为投诉举报类别的个数。
可选的,所述个性化模型采用随机森林算法、梯度提升决策树gbdt算法、或高效梯度提升xgboost算法。
可选的,所述用户的行为记录包括以下至少一项:用户的浏览记录、用户的聊天记录、用户的功能使用记录;所述用户的个人信息包括以下至少一项:用户的地理位置信息、用户的个性标签、用户的ip地址。
可选的,所述装置还包括:全局评估单元,用于按照第一预定时间段内每个投诉举报类别的发生次数,确定投诉举报类别的全局评估结果;所述排序确定单元具体用于:根据所述全局评估结果和所述用户的个性化评估值,确定所述用户的投诉举报类别的排列次序。
可选的,所述装置还包括:区域评估单元,用于按照第二预定时间段内每个投诉举报类别在所述用户所在地域的发生次数,确定投诉举报类别的区域评估结果;所述排序确定单元具体用于:根据所述区域评估结果和所述用户的个性化评估值,确定所述用户的投诉举报类别的排列次序。
可选的,所述装置还包括全局类别单元、区域类别单元,其中:全局类别单元用于将第一预定时间段内发生次数最多的p个投诉举报类别,作为全局类别;区域类别单元用于将除p个全局类别外,在第二预定时间段内发生次数最多的q个投诉举报类别,作为区域类别;所述排序确定单元具体用于:将p个全局类别按发生次数降序排列,之后将q个区域类别按发生次数降序排列,之后按照个性化评估值排列除全局类别和区域类别外剩余的(n-p-q)个投诉举报类别;n为投诉举报类别的个数,p为小于n的自然数,q为不大于(n-p)的自然数。
本说明书的实施例提供了一种计算机设备,该计算机设备包括存储器和处理器。其中,存储器上存储有能够由处理器运行的计算机程序;处理器在运行存储的计算机程序时,执行本说明书实施例中投诉举报类别的排序方法的各个步骤。对投诉举报类别的排序方法的各个步骤的详细描述请参见之前的内容,不再重复。
本说明书的实施例提供了一种计算机可读存储介质,该存储介质上存储有计算机程序,这些计算机程序在被处理器运行时,执行本说明书实施例中投诉举报类别的排序方法的各个步骤。对投诉举报类别的排序方法的各个步骤的详细描述请参见之前的内容,不再重复。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书的实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书的实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。