一种查询咨询账户的方法及装置的制造方法

文档序号:10625157阅读:219来源:国知局
一种查询咨询账户的方法及装置的制造方法
【专利摘要】本申请实施例公开了一种查询咨询账户的方法及装置,该方法包括获取用户的咨询媒介;获取与所述咨询媒介相关的第一账户;获取第一账户中第二账户的最近行为信息;根据所述咨询媒介以及所述最近行为信息计算第二账户的第一权重值;将所述第二账户的第一权重值进行排序。本申请公开的查询咨询账户的方法的实施例,不仅丰富了咨询媒介和用户账户之间的关系,挖掘更多的潜在用户账户,还分析了用户账户和咨询账户间的关系强弱,提高了查询咨询账户的准确率。
【专利说明】
-种查询咨询账户的方法及装置
技术领域
[0001] 本申请设及数据处理技术领域,特别设及一种查询咨询账户的方法及装置。
【背景技术】
[0002] 提供产品或服务的主体,往往配有售后部口或电话、在线咨询之类的部口 W解答 用户提出的问题或咨询。
[0003] 当用户在使用产品或服务的过程遇到问题后,可W通过各种途径(如打电话、在 线求助等)向售后寻求帮助。负责售后或咨询的客服人员通常会根据用户的咨询媒介(如 来电号码、在线咨询的用户ID等)在系统中查询出与该咨询媒介关联的用户账户。在查询 到咨询账户之后,客服人员可W根据该用户围绕产品、服务或提供产品、服务的主体最近发 生的交互信息W 了解用户有可能咨询的问题,从而为用户提供解决方案。
[0004] 现有技术中根据咨询媒介查询账户的方法包括:咨询系统中的服务器基于存有的 咨询媒介与用户账户的关联关系,通过当前咨询媒介匹配出相应的用户账户并输出;客服 人员根据输出的账户逐个向客户询问W确认最终的用户账户。W支付宝来电咨询为例,如 果咨询系统中的服务器基于存有的来电号码与用户账户的关联关系,匹配出与该来电号码 有关联的支付宝账户,现有技术中则直接将该支付宝账户输出;如果匹配到多个账户,则输 出多个。 阳〇化]在实现本申请过程中,发明人发现现有技术中至少存在如下问题:现有技术中,咨 询系统中的服务器通过简单的、关系较强的关联关系(如和咨询媒介绑定的关系)匹配出 和咨询媒介相关的用户账户,没有考虑利用用户的历史行为去挖掘更多的潜在用户账户; 现有技术中咨询系统中的服务器匹配出多个用户账户后,往往是直接输出,而未考虑该用 户账户与实际咨询账户关系的强弱。

【发明内容】

[0006] 本申请实施例的目的是提供一种查询咨询账户的方法及装置,W准确地定位到可 能的咨询账户。
[0007] 为解决上述技术问题,本申请实施例通过W下技术方案来实现:
[0008] 本申请实施例提供了一种查询咨询账户的方法,该方法包括:
[0009] 获取用户的咨询媒介;
[0010] 获取与所述咨询媒介相关的第一账户;
[0011] 获取第一账户中每一第二账户的最近行为信息,所述第二账户为所述第一账户中 的单个账户;
[0012] 根据所述咨询媒介W及所述最近行为信息计算第二账户的第一权重值;
[0013] 将所述第二账户的第一权重值进行排序。
[0014] 本申请还提供了一种查询咨询账户的装置,所述装置包括:咨询媒介模块、第一账 户模块、最近行为信息模块、第一权重值模块W及第一权重值排序模块;其中:
[0015] 所述咨询媒介模块,用于获取用户的咨询媒介;
[0016] 所述第一账户模块,用于获取与所述咨询媒介相关的第一账户;
[0017] 所述最近行为信息模块,用于获取第一账户中每一第二账户的最近行为信息,所 述第二账户为所述第一账户中的单个账户;
[0018] 所述第一权重值模块,根据所述最近行为信息计算第二账户的第一权重值;
[0019] 所述第一权重值排序模块,将第二账户的第一权重值进行排序。
[0020] 由W上本申请实施例提供的技术方案可见,本申请公开的查询咨询账户的方法的 实施例,通过咨询媒介挖掘尽可能多的相关用户账户,一方面考虑相关用户账户的最近行 为信息,一方面计算咨询媒介和用户账户的关系强度,最终将获得的用户账户按照与咨询 账户关系的强弱排序。该实现过程不仅丰富了咨询媒介和用户账户之间的关系,还提高了 查询咨询账户的准确率。
【附图说明】
[0021] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提 下,还可W根据运些附图获得其他的附图。
[0022] 图1是本申请查询咨询账户方法一个实施例的流程图;
[0023] 图2是本申请实施例中计算第一权重值的流程图;
[0024] 图3是第二最近行为包括最近咨询行为信息时,计算第二权重值的流程图;
[00巧]图4是第二最近行为包括最近遇到错误码行为信息时,计算第二权重值的流程 图;
[00%] 图5是第二最近行为包括最近遇到触发风控行为信息时,计算第二权重值的流程 图;
[0027] 图6是本申请查询咨询账户装置一个实施例的模块图;
[0028] 图7是本申请查询咨询账户装置中第一权重值模块一个实施例的模块图。
【具体实施方式】
[0029] 本申请实施例提供一种查询咨询账户的方法及装置。
[0030] 为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实 施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施 例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通 技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护 的范围。
[0031] 图1是本申请查询咨询账户方法的一个实施例的流程图。如图1所述,所述查询 咨询账户方法可W包括:
[0032] S101 :获取用户的咨询媒介。
[0033] 本申请实施例的方法可W由服务器来实现,也可W通过其他电子设备来实现。在 本申请的一个实施例中,可W W服务器为主体来举例说明。本实施例中的服务器,可W是位 于提供咨询或售后一方的咨询系统中的服务器。
[0034] 服务器可W接收用户的咨询媒介。所述咨询媒介可W包括:用户咨询时的来电号 码,用户咨询时所用的身份证号码,或者是用户在线咨询时使用的聊天工具的用户名等。 阳03引 S102 :获取与所述咨询媒介相关的第一账户。
[0036] 服务器可W获取与所述咨询媒介相关的第一账户,获取方法至少包括下述其中一 种。
[0037] 服务器基于存有的咨询媒介与用户账户的关联关系,可W通过获取的咨询媒介匹 配出相应的用户账户。所述的咨询媒介与用户账户的关联关系,可W是由服务器在之前的 处理过程中积累得到的,也可W是设置于服务器中的,或者也可W是从其它设备上获得的。
[0038] 所述咨询媒介可W包括来电号码。相应的,所述获取与所述咨询媒介相关的第一 账户可W包括:获取与所述来电号码绑定的第一账户。具体地,服务器基于存有的电话号码 与用户账户的关联关系,可W通过获取的来电号码匹配出相应的用户账户。所述来电号码 可W是手机来电号码或者座机来电号码。W淘宝账户为例,假设一个淘宝账户只能绑定一 个来电号码,同时一个来电号码可W绑定至少一个淘宝账户。运样,服务器根据所述来电号 码可W匹配到至少一个淘宝账户。
[0039] 所述获取与所述咨询媒介相关的第一账户可W包括:获取给所述来电号码充值的 第一账户。所述来电号码可W是手机来电号码或者座机来电号码。服务器根据系统中记载 的给来电号码充值过的账户,可W匹配出至少一个账户。W淘宝账户为例,用户通过账户A 之前给某一来电号码充过值,用户通过账户B也给所述来电号码充过值。运样,系统记载有 上述给同一来电号码充值的账户A和账户B。在本步骤中,服务器根据所述来电号码,基于 系统中记载的电话号码与充值账户的关系,可W匹配到用户账户A或者用户账户B。
[0040] 所述获取与所述咨询媒介相关的第一账户可W包括:获取使用所述来电号码接收 快递的第一账户。所述来电号码可W是手机来电号码或者座机来电号码。服务器根据系统 中记载的使用该来电号码作为联系电话接收过快递的账户,可W匹配出至少一个账户。W 淘宝账户为例,用户通过账户A使用一来电号码作为接收快递的联系电话,用户通过账户B 也使用所述来电号码作为接收快递的联系电话。运样,系统记载有上述使用同一来电号码 作为接收快递的联系电话的账户A和账户B。在本步骤中,服务器根据所述来电号码,基于 系统中记载的电话号码与接收快递账户的关系,可W匹配到用户账户A或者用户账户B。
[0041] 所述获取与所述咨询媒介相关的第一账户还可W包括:获取使用所述来电号码咨 询过问题的第一账户。所述来电号码可W是手机来电号码或者座机来电号码。同样地,月良 务器根据系统中记载的使用该来电号码咨询过问题的账户,可W匹配出至少一个账户。
[0042] S103:获取第一账户中每一第二账户的最近行为信息,所述第二账户为所述第一 账户中的单个账户。
[0043] 服务器可W获取第一账户中第二账户的最近行为信息。所述最近行为信息至少 包括下述一种:最近咨询行为信息、最近遇到错误码行为信息W及最近触发风控行为信息。 所述第一账户包括获取的所述咨询媒介相关的账户的集合,所述第二账户包括所述集合中 的一个账户。需要说明的是,分第一账户和第二账户表述是为了表达更加准确,避免产生混 淆。
[0044] 所述最近咨询行为信息可W包括最近咨询时间,所述最近咨询时间可W为用户上 一次咨询问题的时间距离当前时间的时间间隔。具体地,服务器对第一账户中第二账户的 咨询行为进行统计,所述咨询行为包括第二账户上一次咨询问题的时间,所述上一次咨询 问题时间和当前时间的时间差为所述最近咨询时间。例如,当前时间为2014年12月2日 17:00,步骤S102中服务器通过来电号码匹配到用户账户A、用户账户B W及用户账户C,根 据用户咨询记录,其中用户账户A在2014年12月2日9:00咨询过问题,用户账户B没有 咨询过问题,用户账户C在2014年11月29日14:00咨询过问题,则用户账户A的最近咨 询时间为6小时,用户账户B的最近咨询时间为无限大,用户账户C的最近咨询时间为75 小时。
[0045] 所述最近遇到错误码行为信息可W包括最近遇到错误码次数,所述最近遇到错误 码次数可W为用户在近段时间内遇到错误码的次数。具体地,服务器可W对第一账户中第 二账户在72小时内遇到错误码的次数进行统计。W淘宝平台为例,用户账户A接收的错 误码可W包括W下Ξ类:HTTP连接错误、平台解析错误W及业务处理错误,例如,用户账户 A输入一个非法的用户名时,服务器发送错误码为601的错误提示给用户,提醒用户输入的 用户名不存在;又如,用户在申请退款不成功时,服务器发送错误码为660的错误提示给用 户,提醒用户不能申请退款。在本发明的一个实施例中,在距离当前时间72小时内,用户账 户A接收到错误码为601的错误提示共3次,接收到错误码为660的错误提示共2次,则用 户最近遇到错误码次数为5。
[0046] 所述最近触发风控行为信息至少可W包括最近触发风控时间和最近触发风控次 数中的一种。风控事件可W为服务器收集的用户的关键行为。W淘宝平台为例,用户的关 键行为具体可包括:安全认证、签约、密码安全等相关事件。例如,用户账户A在退出第一个 账户登录后,用第二个账户登录时,服务器要求用户账户A输入验证码,则上述事件为风控 事件,又如,用户在进入支付宝平台发生付款行为时,客户端进行安全认证行为,则上述事 件也为风控事件。
[0047] 所述最近触发风控时间可W为用户上一次触发风控的时间距离当前时间的时间 间隔。具体地,服务器对第一账户中第二账户的触发风控行为进行统计,所述触发风控行为 可W包括第二账户上一次触发风控的时间,所述上一次触发风控时间和当前时间的时间差 为所述最近触发风控时间。例如,当前时间为2014年12月2日17:00,步骤S102中服务器 通过来电号码匹配到用户账户A、用户账户B W及用户账户C的账户,根据用户风控事件记 录,其中用户账户A在2014年12月2日9:00触发过风控事件,用户账户B没有触发过风 控事件,用户账户C在2014年11月29日18:00触发过风控事件,则用户账户A的最近触 发风控时间为6小时,用户账户B的最近触发风控时间为无限大,用户账户C的最近触发风 控时间为71小时。
[0048] 所述最近触发风控次数可W为用户在近段时间内触发风控事件的次数。具体地, 服务器对第一账户中第二账户在72小时内触发风控事件的次数进行统计。W淘宝平台为 例,在距离当前时间72小时内,用户账户C进行验证码输入共5次,进入支付宝平台付款并 进行安全认证共2次,则用户账户C最近触发风控次数为7。
[0049] S104:根据所述咨询媒介W及所述最近行为信息计算第二账户的第一权重值。
[0050] 计算用户每个最近行为信息的第一权重值,如图2所示,计算步骤具体包括 S201-S203 :
[0051] S201 :计算每个最近行为信息的第二权重值。
[0052] 如步骤S103所述,所述最近行为信息至少包括下述一种:最近咨询行为信息、最 近遇到错误码行为信息W及最近触发风控行为信息,计算每个最近行为信息的第二权重 值。
[0053] 所述最近行为信息包括最近咨询行为信息时,如图3所示,计算所述每个最近行 为信息的第二权重值包括W下具体步骤S301-S303 :
[0054] S301 :获取第二账户的最近咨询行为信息。 阳化5] 如步骤S103所述,所述最近咨询行为信息可W包括最近咨询时间,例如,根据来 电号码匹配到用户账户A、用户账户B W及用户账户C,获取上述用户的最近咨询行为信息, 其中,用户账户A的最近咨询时间为6小时,用户账户B的最近咨询时间为无限大,用户账 户C的最近咨询时间为75小时。
[0056] S302 :判断所述最近咨询行为信息所在的咨询阔值区间。
[0057] 所述咨询阔值区间可W包括4个咨询阔值区间,分别为第一咨询阔值区间,第二 咨询阔值区间,第Ξ咨询阔值区间W及第四咨询阔值区间。所述第一咨询阔值区间包括最 近咨询时间tl,单位为小时,tl的取值范围为0《tl《2,所述第二咨询阔值区间包括最 近咨询时间t2,单位为小时,t2的取值范围为2<t2《24,所述第Ξ咨询阔值区间包括最近 咨询时间t3,单位为小时,t3的取值范围为24<t3《72,所述第四咨询阔值区间包括最近 咨询时间t4,单位为小时,t4的取值范围为t4〉72。
[0058] 在步骤S301举的例子中,所述用户账户A的最近咨询时间落入第二咨询阔值区 间,所述用户账户B的最近咨询时间落入第四咨询阔值区间,所述用户账户C的最近咨询时 间落入第四咨询阔值区间。
[0059] S303:根据所述咨询阔值区间确定最近咨询行为信息的第二权重值。
[0060] 在本发明实施例中,在确定最近咨询时间所在的咨询阔值区间后,根据所述咨询 阔值区间可W确定最近咨询时间的第二权重值,所述咨询阔值区间不相同,对应的最近咨 询时间的第二权重值可W不相同。所述第二权重值的计算公式如式(1)所示: W61] a0*W0Ereqt (1) 阳0创式中,W犯reqt为最近咨询时间的TOE值,aO为TOE reqt对应的回归系数。
[0063] 所述WOEfpqt的计算是在训练样本上进行的,所述训练样本来自于真实的用户咨询 记录数据,人工客服会记录每个咨询账户W及账户的最近行为信息,所述咨询账户为样本 账户,WOE的计算公式如式(2)所示:
[0064]
α)
[0065] 在本发明实施例中,可W根据咨询账户匹配所有相关账户,查询咨询账户的最近 咨询时间并确定所述最近咨询时间落入的咨询阔值区间。所述正样本包括样本账户中最近 咨询时间落入所述咨询阔值区间的账户,所述负样本包括相关账户中最近咨询时间落入所 述咨询阔值区间的账户。举个例子说明,根据训练样本的数据记录,来电号码1对应的咨询 账户为Α,根据A匹配的相关账户个数为30,账户A在15小时前来电咨询过问题,即账户A 的最近咨询时间为15,可见,A的最近咨询时间落入第二咨询阔值区间。在根据A所匹配的 30个相关账户中,落入第二咨询阔值区间的相关账户共7个。来电号码2对应的咨询账户 为B,根据B匹配的相关账户个数为23,账户B在5小时前来电咨询过问题,即账户B的最 近咨询时间为5,可见,B的最近咨询时间也落入第二咨询阔值区间。在根据B所匹配的23 个相关账户中,落入第二咨询阔值区间的相关账户共2个。在该训练样本中,只有账户A W 及账户B的最近咨询时间落入第二咨询阔值区间,那么,第二咨询阔值区间的正样本数量 为2,负样本数量为5+2,则第二咨询阔值区间对应的最近咨询行为信息的WOE值为In (2/7) =-1. 25,其他咨询阔值区间对应的最近咨询行为信息的WOE值计算方法和上述方法相同, 在此不再寶述。
[0066] 所述最近行为信息包括最近遇到错误码行为信息时,如图4所示,计算每个最近 行为信息的第二权重值包括W下具体步骤S401-S403 :
[0067] S401 :获取第二账户的最近遇到错误码行为信息。
[0068] 如步骤S103所述,所述最近遇到错误码行为信息可W包括最近遇到错误码次数, 例如,在距离当前时间72小时内,用户账户A接收到错误码为601的错误提示共3次,接收 到错误码为660的错误提示共2次,则用户最近遇到错误码次数为5。
[0069] S402:判断所述最近遇到错误码行为信息所在的错误码阔值区间。
[0070] 所述错误码阔值区间可W包括4个错误码阔值区间,分别为第一错误码阔值区 间,第二错误码阔值区间,第Ξ错误码阔值区间W及第四错误码阔值区间。所述第一错误码 阔值区间包括最近72小时遇到错误码次数ml,ml的取值范围为ml > 10,所述第二错误码 阔值区间包括最近72小时遇到错误码次数m2,m2的取值范围为5《m2<10,所述第Ξ错误 码阔值区间包括最近72小时遇到错误码次数m3, m3的取值范围为0<m3巧,所述第四错误 码阔值区间包括最近72小时遇到错误码次数m4, m4 = 0。
[0071] 在步骤S401举的例子中,所述用户账户A的最近遇到错误码次数落入第二错误码 阔值区间。
[0072] S403:根据所述错误码阔值区间确定最近遇到错误码行为信息的第二权重值。
[0073] 在本发明实施例中,在确定最近遇到错误码次数所在的错误码阔值区间后,根据 所述错误码阔值区间可W确定最近遇到错误码次数的第二权重值,所述错误码阔值区间不 相同,对应的最近遇到错误码次数的第二权重值可W不相同。所述第二权重值的计算公式 如式(3)所示:
[0074] 日1*胖犯6口 (3) 阳075] 式中,WOEpu为最近遇到错误码次数的WOE值,al为WOE对应的回归系数。
[0076] 同样地,WOE值的计算如公式似所示,在本发明实施例中,根据咨询账户匹配所 有相关账户,查询咨询账户的最近遇到错误码次数并确定所述最近遇到错误码次数落入的 错误码阔值区间,所述正样本为样本账户中最近遇到错误码次数落入所述错误码阔值区间 的账户,所述负样本为相关账户中最近遇到错误码次数落入所述错误码阔值区间的账户。 举个例子说明,根据训练样本的数据记录,来电号码3对应的咨询账户为C,根据C匹配的相 关账户个数为58,账户C在72小时内遇到过20次错误码提示信息,即账户C的最近遇到错 误码次数为20,可见,账户C的最近遇到错误码次数落入第一错误码阔值区间,在根据C所 匹配的58个相关账户中,落入第一错误码阔值区间的相关账户共16个;来电号码4对应的 咨询账户为D,根据D匹配的相关账户个数为36,账户D在72小时内遇到过15次错误码提 示信息,即账户D的最近遇到错误码次数为15,可见,D的最近遇到错误码次数也落入第一 错误码阔值区间,在根据D所匹配的36个相关账户中,落入第一错误码阔值区间的相关账 户共12个,并且,在该训练样本中,只有账户C W及账户D的最近遇到错误码次数落入第一 错误码阔值区间,那么,第一错误码阔值区间的正样本数量为2,负样本数量为16+12,则第 一错误码阔值区间的WOE值为ln(2/28) = -2. 64,其他错误码阔值区间对应的最近错误码 行为信息的WOE值计算方法和上述方法相同,在此不再寶述。
[0077] 所述最近行为信息包括最近触发风控行为信息时,如图5所示,计算每个最近行 为信息的第二权重值包括W下具体步骤S501-S503 :
[0078] S501 :获取第二账户的最近触发风控行为信息。
[0079] 所述最近触发风控行为信息至少包括最近触发风控时间和最近触发风控次数中 的一种。
[0080] 所述最近触发风控行为信息包括最近触发风控时间时,如步骤S103所述,例如, 根据来电号码匹配到用户账户A、用户账户B W及用户账户C,获取上述用户的最近触发风 控行为信息,其中,用户账户A的最近触发风控时间为6小时,用户账户B的最近触发风控 时间为无限大,用户账户C的最近触发风控时间为71小时。
[0081] 所述最近触发风控行为信息包括最近触发风控时间时,如步骤S103所述,例如, 用户账户D最近触发风控次数为7。
[0082] S502 :判断所述最近触发风控行为信息所在的风控阔值区间。
[0083] 所述风控阔值区间可W包括4个风控阔值区间,分别为第一风控阔值区间,第二 风控阔值区间,第Ξ风控阔值区间W及第四风控阔值区间。
[0084] 所述最近触发风控行为信息包括最近触发风控时间时,所述第一风控阔值区间包 括最近触发风控时间T1,单位为小时,T1的取值范围为0《T1《2 ;所述第二风控阔值区 间包括最近触发风控时间T2,单位为小时,T2的取值范围为2<Τ2《24 ;所述第Ξ风控阔值 区间包括最近触发风控时间Τ3,单位为小时,Τ3的取值范围为24<Τ3《72 ;所述第四风控 阔值区间包括最近触发风控时间Τ4,单位为小时,Τ4的取值范围为Τ4〉72。
[00化]在步骤S501举的例子中,所述用户账户A的最近触发风控时间落入第二风控阔值 区间,所述用户账户B的最近触发风控时间落入第四风控阔值区间,所述用户账户C的最近 触发风控时间落入第Ξ风控阔值区间。
[0086] 所述最近触发风控行为信息包括最近触发风控次数时,所述第一风控阔值区间包 括最近72小时遇到触发风控的次数nl,nl的取值范围为nl > 10 ;所述第二风控阔值区间 包括最近72小时遇到触发风控的次数n2,n2的取值范围为5《n2<10 ;所述第Ξ风控阔值 区间包括最近72小时遇到触发风控的次数n3, n3的取值范围为0<n3巧;所述第四风控阔 值区间包括最近72小时遇到触发风控的次数n4, n4 = 0。
[0087] 在步骤S501举的例子中,所述用户账户D最近触发风控次数落入第二风控阔值区 间。
[0088] S503:根据所述风控阔值区间确定最近触发风控行为信息的第二权重值。
[0089] 在本发明实施例中,所述最近触发风控行为信息包括最近触发风控时间时,在确 定最近触发风控时间所在的风控阔值区间后,根据所述风控阔值区间可W确定最近触发风 控时间的第二权重值,所述风控阔值区间不相同,对应的最近风控时间的第二权重值可W 不相同。所述第二权重值的计算公式为:
[0090] a2*W犯 event (4)
[0091] 式中,WOEeveM为最近触发风控时间的WOE值,a2为WOE event对应的回归系数。
[0092] 同样地,WOE值的计算如公式(2)所示,在本发明实施例中,根据咨询账户匹配所 有相关账户,查询咨询账户的最近触发风控时间并确定所述最近触发风控时间落入的风控 阔值区间。所述正样本为样本账户中最近触发风控时间落入所述风控阔值区间的账户,所 述负样本为相关账户中最近触发风控时间落入所述风控阔值区间的账户。举个例子说明, 根据训练样本的数据记录,来电号码1对应的咨询账户为E,根据E匹配的相关账户个数为 30,账户E在15小时前来电咨询过问题,即账户E的最近触发风控时间为15,可见,E的最 近触发风控时间落入第二风控阔值区间,在根据E所匹配的30个相关账户中,落入第二风 控阔值区间的相关账户共7个;来电号码2对应的咨询账户为F,根据F匹配的相关账户个 数为23,账户F在5小时前来电咨询过问题,即账户F的最近触发风控时间为5,可见,F的 最近触发风控时间也落入第二风控阔值区间,在根据F所匹配的23个相关账户中,落入第 二风控阔值区间的相关账户共2个,并且,在该训练样本中,只有账户E W及账户F的最近 触发风控时间落入第二风控阔值区间,那么,第二风控阔值区间的正样本数量为2,负样本 数量为5+2,则第二风控阔值区间对应的最近咨询行为信息的WOE值为In (2/7) = -1. 25, 其他风控阔值区间对应的最近咨询行为信息的WOE值计算方法和上述方法相同,在此不再 寶述。
[0093] 所述最近触发风控行为信息包括最近触发风控时间时,在确定最近触发风控次数 所在的风控阔值区间后,根据所述风控阔值区间可W确定最近触发风控时间的第二权重 值,所述风控阔值区间不相同,对应的最近风控时间的第二权重值可W不相同。所述第二权 重值的计算公式为:
[0094] a3*W犯 eventN 妨
[0095] 式中,WOE。、。。,,为最近触发风控次数的WOE值,曰3为WOE 对应的回归系数。
[0096] 同样地,WOE值的计算如公式(2)所示,在本发明实施例中,根据咨询账户匹配所 有相关账户,查询咨询账户的最近遇到风控次数并确定所述最近遇到风控次数落入的风控 阔值区间,所述正样本为样本账户中最近遇到风控次数落入所述风控阔值区间的账户,所 述负样本为相关账户中最近遇到风控次数落入所述风控阔值区间的账户。举个例子说明, 根据训练样本的数据记录,来电号码3对应的咨询账户为G,根据G匹配的相关账户个数为 58,账户G在72小时内遇到过20次风控提示信息,即账户G的最近遇到风控次数为20, 可见,账户G的最近遇到风控次数落入第一风控阔值区间,在根据G所匹配的58个相关账 户中,落入第一风控阔值区间的相关账户共16个;来电号码4对应的咨询账户为H,根据Η 匹配的相关账户个数为36,账户Η在72小时内遇到过15次风控提示信息,即账户Η的最 近遇到风控次数为15,可见,Η的最近遇到风控次数也落入第一风控阔值区间,在根据Η所 匹配的36个相关账户中,落入第一风控阔值区间的相关账户共12个,并且,在该训练样本 中,只有账户G W及账户Η的最近遇到风控次数落入第一风控阔值区间,那么,第一风控阔 值区间的正样本数量为2,负样本数量为16+12,则第一风控阔值区间的WOE值为In (2/28) =-2. 64,其他风控阔值区间对应的最近错误码行为信息的WOE值计算方法和上述方法相 同,在此不再寶述。
[0097] 在上述实施例中,分别对应于TOEf。。" W犯。",WOEw。。, W及TOE 的回归系数aO、 al、a2 W及a3可W利用现有技术中的逻辑回归算法确定,具体计算步骤包括: 阳09引 SS1 :获取训练样本,计算每个样本的WOE向量,所述WOE值向量包括[WOE,。。。W0 E err) WOEevent) WOGeventN] 〇
[0099] SS2 :确定逻辑回归函数。 阳100] 所述逻辑函数可W是: 阳 101]
(6) 阳10引其中,a是回归系数向量,X是WOE值向量。 阳103] SS3 :对所有训练样本进行极大似然估计。
[0104] 得到似然函数为: 阳1化]
(7)
[0106] 其中,表示第i个训练样本的WOE值向量,y 1表示第i个训练样本是否是咨询 账户,若是,yi= 1 ;否则,y i= 0。
[0107] 对式(7)求对数:
[0108]
(8)
[0109] SS4 :确定回归系数aO~曰3的值。
[0110] 将式做转化为W a为变量的目标方程J (a):
[0116] 其中,所述收敛条件是:按式(11)每次迭代后,目标变量J(a)的变化小于一个预 设值,如0. 001。
[0117] S202 :计算咨询媒介和第二账户的关系分值;
[0118] 在本发明一实施例中,咨询媒介b对第二账户a的关系分值的表达式为: 阳119]
阳121] 在上述公式中,strengths, b>的计算是基于训练样本进行的,strengths, b>代 表b对a的关系强弱指数,W a为主体;η代表咨询媒介和账户之间使用过的交互行为的种 类,W咨询媒介是来电号码为例,所述来电号码和账户之间的交互行为可W是所述账户和 来电号码绑定,所述交互行为可W是所述账户接收快递的联系方式为所述来电号码,所述 交互行为可W是所述账户给所述来电号码充值,所述交互行为还可W是所述账户使用所述 来电号码咨询问题;频次指a、b之间进行某种交互行为的次数;咨询媒介和账户交互行为 权重的计算公式中,分母代表a总共与多少咨询媒介发生过交互行为K,所述咨询媒介可W 是身份证号码,可W是来电号码,还可W是聊天工具用户名;咨询媒介和账户交互行为频次 的计算公式中,Num<a,b>比]代表a、b进行交互行为K的次数,分母的真数部分代表a与所 有咨询媒介的总交互次数。 阳122] S203:将所有最近行为信息的第二权重值和所述关系分值进行叠加。
[0123] 计算所有最近行为信息的第二权重值和关系分值的和值,所述和值即为第二账户 的第一权重值。 阳124] S105 :将第二账户的第一权重值进行排序。
[01巧]获取所有第二账户的第一权重值后,对所述第一权重值进行排序,其中第一权重 值最大的第二账户为查询得到的咨询账户。
[01%] 本申请公开的查询咨询账户的方法的实施例,通过咨询媒介挖掘尽可能多的相关 咨询账户,一方面考虑相关账户的最近行为信息,一方面计算咨询媒介和账户的关系强度, 最终获得每个相关咨询账户的权重值。该实现过程不仅丰富了咨询媒介和账户之间的关 系,还提高了查询咨询账户的准确率。从客户服务质量方面考虑,不仅免去额外的输入信息 操作,提高了用户体验,在准确定位到账户后,还可W更好地识别账户问题,提高服务效率。 阳127] 下面介绍本申请查询咨询账户的装置的一个实施例。图6是本申请一种查询咨询 账户的一个实施例的组成结构图。如图6所示,所述查询咨询账户的装置包括:咨询媒介模 块100、第一账户模块200、最近行为信息模块300、第一权重值模块400 W及第一权重值排 序模块500。其中,
[0128] 所述咨询媒介模块,用于获取用户的咨询媒介;
[0129] 所述第一账户模块,用于获取与所述咨询媒介相关的第一账户;
[0130] 所述最近行为信息模块,用于获取第一账户中第二账户的最近行为信息; 阳131] 所述第一权重值模块,根据所述最近行为信息计算第二账户的第一权重值; 阳132] 所述第一权重值排序模块,将第二账户的第一权重值进行排序。
[0133] 所述最近行为信息模块至少包括W下一种模块:最近咨询行为信息模块、最近遇 到错误码行为信息模块W及最近触发风控行为信息模块。
[0134] 如图7所示,所述第一权重值模块400,包括:第二权重值模块410、关系分值模块 420 W及叠加模块430 ;其中,
[0135] 所述第二权重值模块,用于计算最近行为信息的第二权重值; 阳136] 所述关系分值模块,用于计算咨询媒介和第二账户的关系分值; 阳137] 所述叠加模块,用于将关系分值和所有最近行为信息的第二权重值进行叠加。
[0138] 上述查询咨询账户的装置描述得相对简单,所述装置与方法实施例相对应,相关 之处参考方法实施例。
[0139] 在20世纪90年代,对于一个技术的改进可W很明显地区分是硬件上的改进(例 如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改 进)。然而,随着技术的发展,当今的很多方法流程的改进已经可W视为硬件电路结构的直 接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路 结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑 器件(Programm油le Logic Device, PLD)(例如现场可编程口阵列(Field Programm油le Gate Array, FPGA))就是运样一种集成电路,其逻辑功能由用户对器件编程来确定。由设 计人员自行编程来把一个数字系统"集成"在一片PLD上,而不需要请忍片制造厂商来设 计和制作专用的集成电路忍片2。而且,如今,取代手工地制作集成电路忍片,运种编程也 多半改用"逻辑编译器(logic compiler)"软件来实现,它与程序开发撰写时所用的软件 编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描 述语言(Hardware Description Language,皿L),而皿L也并非仅有一种,而是有许多种, 女日 ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、 JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等,目前最普遍使用的是 VHDL(Ve;ry-Hi曲-Speed Integrated Circuit Hardware Description Language)与 Verilog2。本领域技术人员 也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路 中,就可W很容易得到实现该逻辑方法流程的硬件电路。
[0140] 控制器可W按任何适当的方式实现,例如,控制器可W采取例如微处理器或处理 器W及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算 机可读介质、逻辑口、开关、专用集成电路(Application Specific Integrated Cir州it, ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于W下微控制 器:ARC 625D、Atmel AT91SAM、Microchip PIC18F2服20 W及 Silicone L油S C8051F320, 存储器控制器还可W被实现为存储器的控制逻辑的一部分。 阳141] 本领域技术人员也知道,除了 W纯计算机可读程序代码方式实现控制器W外,完 全可W通过将方法步骤进行逻辑编程来使得控制器W逻辑口、开关、专用集成电路、可编程 逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此运种控制器可W被认为是一种 硬件部件,而对其内包括的用于实现各种功能的装置也可W视为硬件部件内的结构。或者 甚至,可W将用于实现各种功能的装置视为既可W是实现方法的软件模块又可W是硬件部 件内的结构。
[0142] 上述实施例阐明的系统、装置、模块或单元,具体可W由计算机忍片或实体实现, 或者由具有某种功能的产品来实现。 阳143] 为了描述的方便,描述W上装置时W功能分为各种单元分别描述。当然,在实施本 申请时可W把各单元的功能在同一个或多个软件和/或硬件中实现。
[0144] 通过W上的实施方式的描述可知,本领域的技术人员可W清楚地了解到本申请可 借助软件加必需的通用硬件平台的方式来实现。基于运样的理解,本申请的技术方案本质 上或者说对现有技术做出贡献的部分可软件产品的形式体现出来,在一个典型的配置 中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。该计算机 软件产品可W包括若干指令用W使得一台计算机设备(可W是个人计算机,服务器,或者 网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。该计算机软件产 品可W存储在内存中,内存可能包括计算机可读介质中的非永久性存储器,随机存取存储 器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是 计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体 可W由任何方法或技术来实现信息存储。信息可W是计算机可读指令、数据结构、程序的模 块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取 存储器(SRAM)、动态随机存取存储器值RAM)、其他类型的随机存取存储器(RAM)、只读存储 器(ROM)、电可擦除可编程只读存储器巧EPROM)、快闪记忆体或其他内存技术、只读光盘只 读存储器(CD-ROM)、数字多功能光盘值VD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储 或其他磁性存储设备或任何其他非传输介质,可用于存储可W被计算设备访问的信息。按 照本文中的界定,计算机可读介质不包括短暂电脑可读媒体(transitory media),如调制 的数据信号和载波。
[0145] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部 分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实 施例而言,由于其基本相似于方法实施例,所W描述的比较简单,相关之处参见方法实施例 的部分说明即可。 阳146] 本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、月良 务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置 顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括W上任何系统或设备 的分布式计算环境等等。 阳147] 本申请可W在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序 模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组 件、数据结构等等。也可W在分布式计算环境中实践本申请,在运些分布式计算环境中,由 通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可W 位于包括存储设备在内的本地和远程计算机存储介质中。
[0148] 虽然通过实施例描绘了本申请,本领域普通技术人员知道,本申请有许多变形和 变化而不脱离本申请的精神,希望所附的权利要求包括运些变形和变化而不脱离本申请的 精神。
【主权项】
1. 一种查询咨询账户的方法,其特征在于,包括: 获取用户的咨询媒介; 获取与所述咨询媒介相关的第一账户; 获取第一账户中每一第二账户的最近行为信息,所述第二账户为所述第一账户中的单 个账户; 根据所述咨询媒介W及所述最近行为信息计算第二账户的第一权重值; 将所述第二账户的第一权重值进行排序。2. 根据权利要求1所述的一种查询咨询账户的方法,其特征在于,所述最近行为信息 至少包括W下一种:最近咨询行为信息、最近遇到错误码行为信息W及最近触发风控行为 f目息。3. 根据权利要求2所述的一种查询咨询账户的方法,其特征在于,所述根据所述咨询 媒介W及所述最近行为信息计算第二账户的第一权重值,包括: 计算每个最近行为信息的第二权重值; 计算咨询媒介和第二账户的关系分值; 将所有最近行为信息的第二权重值和所述关系分值进行叠加。4. 根据权利要求3所述的一种查询咨询账户的方法,其特征在于,所述最近行为信息 包括最近咨询行为信息时,所述计算每个最近行为信息的第二权重值,具体包括: 获取第二账户的最近咨询行为信息; 判断所述最近咨询行为信息所在的咨询阔值区间; 根据所述咨询阔值区间确定最近咨询行为信息的第二权重值。5. 根据权利要求4所述的一种查询咨询账户的方法,其特征在于,所述最近咨询行为 信息包括最近咨询时间。6. 根据权利要求5所述的一种查询咨询账户的方法,其特征在于,所述根据所述咨询 阔值区间确定第二权重值,具体包括: 利用下式计算所述第二权重值: aO*W 犯"qt 其中,WOEreqt为最近咨询时间的WOE值,aO为WOE reqt对应的回归系数。7. 根据权利要求6所述的一种查询咨询账户的方法,其特征在于,所述咨询阔值区间 包括4个咨询阔值区间; 所述最近咨询时间的WOE值WOEfpqt与任一咨询阔值区间中正样本数量、负样本数量具 有如下关系:其中,正样本数量包括样本账户中最近咨询时间落入所述咨询阔值区间的账户数量, 负样本数量包括相关账户中最近咨询时间落入所述咨询阔值区间的账户数量,所述相关账 户与所述样本账户的咨询媒介相关。8. 根据权利要求7所述的一种查询咨询账户的方法,其特征在于, 第一咨询阔值区间包括最近咨询时间tl,单位为小时,tl的取值范围为0《tl《2 ; 第二咨询阔值区间包括最近咨询时间t2,单位为小时,t2的取值范围为2<t2《24 ; 第S咨询阔值区间包括最近咨询时间t3,单位为小时,t3的取值范围为24<t3《72 ; 第四咨询阔值区间包括最近咨询时间t4,单位为小时,t4的取值范围为t4〉72。9. 根据权利要求3所述的一种查询咨询账户的方法,其特征在于,所述最近行为信息 包括最近遇到错误码行为信息时,所述计算每个最近行为信息的第二权重值,具体包括: 获取第二账户的最近遇到错误码行为信息; 判断所述最近遇到错误码行为信息所在的错误码阔值区间; 根据所述错误码阔值区间确定最近遇到错误码行为信息第二权重值。10. 根据权利要求9所述的一种查询咨询账户的方法,其特征在于,所述最近遇到错误 码行为信息包括用户最近遇到错误码次数。11. 根据权利要求10所述的一种查询咨询账户的方法,其特征在于,所述根据所述错 误码阔值区间确定第二权重值,具体包括: 利用下式计算所述第二权重值: 日1*胖犯6打 其中,WOEpff为最近遇到错误码次数的WOE值,al为WOE对应的回归系数。12. 根据权利要求10所述的一种查询咨询账户的方法,其特征在于, 所述错误码阔值区间包括4个错误码阔值区间; 所述最近遇到错误码次数的WOE值胖06。"与任一错误码阔值区间中正样本数量、负样 本数量具有如下关系:其中,正样本数量包括样本账户中最近遇到错误码次数落入所述错误码阔值区间的账 户数量,负样本数量包括相关账户中最近遇到错误码次数落入所述错误码阔值区间的账户 数量,所述相关账户与所述样本账户的咨询媒介相关。13. 根据权利要求12所述的一种查询咨询账户的方法,其特征在于, 第一错误码阔值区间包括最近72小时遇到错误码次数ml,ml的取值范围为ml > 10; 第二错误码阔值区间包括最近72小时遇到错误码次数m2, m2的取值范围为 5《m2<10 ; 第S错误码阔值区间包括最近72小时遇到错误码次数m3, m3的取值范围为0<m3巧; 第四错误码阔值区间包括最近72小时遇到错误码次数m4, m4 = 0。14. 根据权利要求3所述的一种查询咨询账户的方法,其特征在于,所述计算每个最近 行为信息的第二权重值,包括: 所述最近行为信息包括最近触发风控行为信息时,所述计算每个最近行为信息的第二 权重值,具体包括: 获取第二账户的最近触发风控行为信息; 判断所述最近触发风控行为信息所在的风控阔值区间; 根据所述风控阔值区间确定最近触发风控行为信息的第二权重值。15. 根据权利要求14所述的一种查询咨询账户的方法,其特征在于,所述最近触发风 控行为信息至少包括最近触发风控时间和最近触发风控次数中的一种。16. 根据权利要求15所述的一种查询咨询账户的方法,其特征在于,所述最近触发风 控行为信息包括最近触发风控时间时,所述根据所述风控阔值区间确定第二权重值,具体 包括: 利用下式计算所述第二权重值: a2*W0Eev 州 t 其中,WOEeve。为最近触发风控时间的WOE值,曰2为WOE event对应的回归系数。17. 根据权利要求16所述的一种查询咨询账户的方法,其特征在于, 所述风控阔值区间包括4个风控阔值区间; 所述最近触发风控时间的WOE值WOEpwm与任一风控阔值区间中正样本数量、负样本数 量具有如下对应关系:其中,正样本数量包括样本账户中最近触发风控时间落入所述风控阔值区间的账户数 量,负样本数量包括相关账户中最近触发风控时间落入所述风控阔值区间的账户数量,所 述相关账户与所述样本账户的咨询媒介相关。18. 根据权利要求17所述的一种查询咨询账户的方法,其特征在于, 第一风控阔值区间包括最近触发风控时间Tl,单位为小时,Tl的取值范围为 0《Tl《2 ; 第二风控阔值区间包括最近触发风控时间T2,单位为小时,T2的取值范围为 2<T2 ^ 24 ; 第S风控阔值区间包括最近触发风控时间T3,单位为小时,T3的取值范围为 24<T3《72 ; 第四风控阔值区间包括最近触发风控时间T4,单位为小时,T4的取值范围为T4〉72。19. 根据权利要求15所述的一种查询咨询账户的方法,其特征在于,所述最近触发风 控行为信息包括最近触发风控次数时,所述根据所述风控阔值区间确定第二权重值,具体 包括:所述第二权重值的计算公式为: a3*W0Eev 州 tN 式中,WOEpwmw为最近触发风控时间的WOE值,a3为WOE WPMW对应的回归系数。20. 根据权利要求19所述的一种查询咨询账户的方法,其特征在于, 所述风控阔值区间包括4个风控阔值区间; 所述最近触发风控次数的WOE值WOEpwmw与任一风控阔值区间中正样本数量、负样本 数量具有如下对应关系:其中,正样本数量包括样本账户中最近触发风控次数落入所述风控阔值区间的账户数 量,负样本数量包括相关账户中最近触发风控次数落入所述风控阔值区间的账户数量,所 述相关账户与所述样本账户的咨询媒介相关。21. 根据权利要求20所述的一种查询咨询账户的方法,其特征在于, 第一风控阔值区间包括最近72小时遇到触发风控的次数nl,nl的取值范围为 nl > 10 ; 第二风控阔值区间包括最近72小时遇到触发风控的次数n2, n2的取值范围为 5《n2<10 ; 第S风控阔值区间包括最近72小时遇到触发风控的次数n3, n3的取值范围为 0<n3<5 ; 第四风控阔值区间包括最近72小时遇到触发风控的次数n4, n4 = 0。22. 根据权利要求3所述的一种查询咨询账户的方法,其特征在于,所述计算咨询媒介 和第二账户的关系分值,包括:咨询媒介b对第二账户a的关系分值的计算公式为:其中,strengths, b>代表b对a的关系分值,W a为主体;n代表咨询媒介和账户之间 使用过的交互行为的种类;频次指a、b之间进行某种交互行为的次数;咨询媒介和账户交 互行为权重的计算公式中,分母代表a总共与多少咨询媒介发生过交互行为K ;咨询媒介和 账户交互行为频次的计算公式中,Num<a,b>比]代表a、b进行交互行为K的次数,分母的真 数部分代表a与所有咨询媒介的总交互次数。23. 根据权利要求1所述的一种查询咨询账户的方法,其特征在于,所述咨询媒介至少 包括来电号码、身份证号码W及聊天工具用户名中的一种。24. 根据权利要求23所述的一种查询咨询账户的方法,其特征在于,所述媒介包括来 电号码时,所述获取与所述咨询媒介相关的第一账户,至少包括下述一种: 获取与所述来电号码绑定的第一账户; 获取给所述来电号码充值的第一账户; 获取使用所述来电号码接收快递的第一账户; 获取使用所述来电号码咨询过问题的第一账户。25. -种查询咨询账户的装置,其特征在于,包括:咨询媒介模块、第一账户模块、最近 行为信息模块、第一权重值模块W及第一权重值排序模块;其中: 所述咨询媒介模块,用于获取用户的咨询媒介; 所述第一账户模块,用于获取与所述咨询媒介相关的第一账户; 所述最近行为信息模块,用于获取第一账户中每一第二账户的最近行为信息,所述第 二账户为所述第一账户中的单个账户; 所述第一权重值模块,根据所述最近行为信息计算第二账户的第一权重值; 所述第一权重值排序模块,将第二账户的第一权重值进行排序。26. 根据权利要求25所述的一种查询咨询账户的装置,其特征在于,所述最近行为信 息模块至少包括W下一种模块:最近咨询行为信息模块、最近遇到错误码行为信息模块W 及最近触发风控行为信息模块。27.根据权利要求26所述的一种查询咨询账户的装置,其特征在于,所述第一权重值 模块,包括:第二权重值模块、关系分值模块W及叠加模块;其中, 所述第二权重值模块,用于计算每个最近行为信息的第二权重值; 所述关系分值模块,用于计算咨询媒介和第二账户的关系分值; 所述叠加模块,用于将关系分值和第二最近行为的第二权重值进行叠加。
【文档编号】G06Q30/00GK105989501SQ201510054404
【公开日】2016年10月5日
【申请日】2015年2月3日
【发明人】王峰伟, 何慧梅, 何帝君, 钟灵, 付敏
【申请人】阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1