一种用户识别方法、向用户展示数据的方法和相关装置与流程

文档序号:25861359发布日期:2021-07-13 16:17阅读:80来源:国知局
一种用户识别方法、向用户展示数据的方法和相关装置与流程

本发明涉及计算机技术领域,尤其涉及一种用户识别方法、向用户展示数据的方法和相关装置。



背景技术:

在线客服系统已成为电子商务网站的重要组成部分,消费者通过在线客服系统咨询了解想要购买的商品是一种便捷途径。对于售前场景,客服期望通过自己对用户(即顾客)的答疑来促使用户下单购买商品,对于仅仅是咨询或对比而不准备下单的用户,客服并不希望花费大量的时间或精力在该用户身上。促成率高的客服也直接反应了该客服的服务能力和转化能力,因此,针对性地服务于下单概率高的用户,一定程度可提升咨询转化率。现有方案基于历史用户下单数和下单率生成用户画像标签,即:针对用户在平台上的历史购物记录及咨询记录,将咨询下单比高的用户打上标签,后续客服可直观地看到用户标签而进行针对性的服务。

在实现本发明过程中,发明人发现现有技术中至少存在如下问题:

预测用户下单概率时未考虑用户与客服的对话内容,无法根据当前用户所处场景来更准确地预测用户下单概率,且无法实时监测用户下单的可能性,对潜在下单用户的识别准确率低,无法针对性地向用户推荐商品或服务等数据。



技术实现要素:

有鉴于此,本发明实施例提供一种用户识别方法、向用户展示数据的方法和相关装置,能够基于用户与客服的对话内容预测用户下单概率,从而根据当前用户所处场景来更准确地预测用户下单行为,可实时监测用户下单的可能性,准确识别潜在下单用户,并可针对性地向用户推荐商品或服务等数据。

为实现上述目的,根据本发明实施例的一个方面,提供了一种用户识别方法。

一种用户识别方法,包括:获取当前用户的会话数据、行为轨迹数据、历史行为画像数据;基于所述会话数据、所述行为轨迹数据、所述历史行为画像数据构建所述当前用户的下单行为特征集;将所述下单行为特征集输入下单概率模型,以计算所述当前用户产生下单行为的概率值;在所述概率值大于预设阈值的情况下,将所述当前用户识别为潜在下单用户。

可选地,所述基于所述会话数据、所述行为轨迹数据、所述历史行为画像数据构建所述当前用户的下单行为特征集,包括:基于所述会话数据构建所述当前用户的会话参数特征、用户文本特征、客服文本特征,基于所述行为轨迹数据构建所述当前用户的行为轨迹特征,基于所述历史行为画像数据构建所述当前用户的历史画像特征,所述下单行为特征集包括所述会话参数特征、所述用户文本特征、所述客服文本特征、所述行为轨迹特征、所述历史画像特征。

可选地,所述基于所述会话数据构建所述当前用户的会话参数特征,包括:从所述当前用户的会话数据中提取会话时长、用户消息数、客服消息数、客服平均响应时长、用户平均响应时长、用户切出会话次数中的一种或多种信息,以构建得到所述当前用户的会话参数特征,其中,所述当前用户的会话数据为所述当前用户与当前会话的客服之间已产生的会话文本的集合,所述用户切出会话次数为所述当前用户在当前会话中切换到其他操作的次数。

可选地,所述基于所述行为轨迹数据构建所述当前用户的行为轨迹特征,包括:从所述当前用户的行为轨迹数据中提取所述当前用户的会话开始前商品点击记录、会话开始前点击商品数、会话开始前点击同会话品类商品数、关于点击商品是否包含会话携带商品参数的记录、关于所述当前用户是否咨询其他客服的记录中的一种或多种信息,以构建得到所述当前用户的行为轨迹特征,其中,所述当前用户的行为轨迹数据为所述当前用户在当前会话开始前的预设时间长度内一种或多种预设行为的轨迹数据。

可选地,所述基于所述历史行为画像数据构建所述当前用户的历史画像特征,包括:从所述当前用户的历史行为画像数据中提取所述当前用户的预设时段内的下单数、咨询客服数、客单价、咨询下单比中的一种或多种信息,以构建得到所述当前用户的历史画像特征。

可选地,基于多层感知机、第一循环神经网络、第二循环神经网络进行网络结构组合,得到所述下单概率模型,其中,所述多层感知机的输入为所述会话参数特征、所述行为轨迹特征、所述历史画像特征,所述第一循环神经网络的输入为所述用户文本特征,所述第二循环神经网络的输入为所述客服文本特征。

可选地,在预设的触发条件下,获取所述当前用户的所述会话数据、所述行为轨迹数据、所述历史行为画像数据,以实时调用所述下单概率模型计算所述当前用户产生下单行为的概率值,其中,所述预设的触发条件为:当前生成一条所述当前用户的会话文本或当前生成一条与所述当前用户进行会话的客服的会话文本。

可选地,还包括:基于用户样本的历史会话数据样本、历史行为轨迹数据样本、历史行为画像数据样本,构建所述用户样本的下单行为特征样本集;根据从历史会话开始至所述历史会话结束后指定时间段内所述用户样本的下单记录,自动生成所述用户样本的下单标签,所述历史会话是所述历史会话数据样本所属的会话;利用所述用户样本的下单行为特征样本集和对应的所述下单标签,训练所述下单概率模型。

根据本发明实施例的另一方面,提供了一种向用户展示数据的方法。

一种基于本发明实施例的用户识别方法向用户展示数据的方法,包括:在将所述当前用户识别为所述潜在下单用户的情况下,向所述当前用户展示特定的商品数据或服务数据。

根据本发明实施例的又一方面,提供了一种用户识别装置。

一种用户识别装置,包括:数据获取模块,用于获取当前用户的会话数据、行为轨迹数据、历史行为画像数据;特征构建模块,用于基于所述会话数据、所述行为轨迹数据、所述历史行为画像数据构建所述当前用户的下单行为特征集;概率计算模块,用于将所述下单行为特征集输入下单概率模型,以计算所述当前用户产生下单行为的概率值;用户识别模块,用于在所述概率值大于预设阈值的情况下,将所述当前用户识别为潜在下单用户。

可选地,所述特征构建模块还用于:基于所述会话数据构建所述当前用户的会话参数特征、用户文本特征、客服文本特征,基于所述行为轨迹数据构建所述当前用户的行为轨迹特征,基于所述历史行为画像数据构建所述当前用户的历史画像特征,所述下单行为特征集包括所述会话参数特征、所述用户文本特征、所述客服文本特征、所述行为轨迹特征、所述历史画像特征。

可选地,所述特征构建模块包括会话参数特征构建子模块,用于:从所述当前用户的会话数据中提取会话时长、用户消息数、客服消息数、客服平均响应时长、用户平均响应时长、用户切出会话次数中的一种或多种信息,以构建得到所述当前用户的会话参数特征,其中,所述当前用户的会话数据为所述当前用户与当前会话的客服之间已产生的会话文本的集合,所述用户切出会话次数为所述当前用户在当前会话中切换到其他操作的次数。

可选地,所述特征构建模块包括行为轨迹特征构建子模块,用于:从所述当前用户的行为轨迹数据中提取所述当前用户的会话开始前商品点击记录、会话开始前点击商品数、会话开始前点击同会话品类商品数、关于点击商品是否包含会话携带商品参数的记录、关于所述当前用户是否咨询其他客服的记录中的一种或多种信息,以构建得到所述当前用户的行为轨迹特征,其中,所述当前用户的行为轨迹数据为所述当前用户在当前会话开始前的预设时间长度内一种或多种预设行为的轨迹数据。

可选地,所述特征构建模块包括历史画像特征构建子模块,用于:从所述当前用户的历史行为画像数据中提取所述当前用户的预设时段内的下单数、咨询客服数、客单价、咨询下单比中的一种或多种信息,以构建得到所述当前用户的历史画像特征。

可选地,还包括模型建立模块,用于基于多层感知机、第一循环神经网络、第二循环神经网络进行网络结构组合,得到所述下单概率模型,其中,所述多层感知机的输入为所述会话参数特征、所述行为轨迹特征、所述历史画像特征,所述第一循环神经网络的输入为所述用户文本特征,所述第二循环神经网络的输入为所述客服文本特征。

可选地,所述数据获取模块还用于:在预设的触发条件下,获取所述当前用户的所述会话数据、所述行为轨迹数据、所述历史行为画像数据,以实时调用所述下单概率模型计算所述当前用户产生下单行为的概率值,其中,所述预设的触发条件为:当前生成一条所述当前用户的会话文本或当前生成一条与所述当前用户进行会话的客服的会话文本。

可选地,还包括模型训练模块,用于:基于用户样本的历史会话数据样本、历史行为轨迹数据样本、历史行为画像数据样本,构建所述用户样本的下单行为特征样本集;根据从历史会话开始至所述历史会话结束后指定时间段内所述用户样本的下单记录,自动生成所述用户样本的下单标签,所述历史会话是所述历史会话数据样本所属的会话;利用所述用户样本的下单行为特征样本集和对应的所述下单标签,训练所述下单概率模型。

根据本发明实施例的又一方面,提供了一种向用户展示数据的装置。

一种基于本发明实施例的用户识别装置向用户展示数据的装置,包括:数据展示模块,用于在将所述当前用户识别为所述潜在下单用户的情况下,向所述当前用户展示特定的商品数据或服务数据。

根据本发明实施例的又一方面,提供了一种电子设备。

一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现本发明实施例所提供的用户识别方法或向用户展示数据的方法。

根据本发明实施例的又一方面,提供了一种计算机可读介质。

一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例所提供的用户识别方法或向用户展示数据的方法。

上述发明中的一个实施例具有如下优点或有益效果:获取当前用户的会话数据、行为轨迹数据、历史行为画像数据,基于获取的会话数据、行为轨迹数据、历史行为画像数据构建当前用户的下单行为特征集,将当前用户的下单行为特征集输入下单概率模型,以计算当前用户产生下单行为的概率值,在概率值大于预设阈值的情况下,将当前用户识别为潜在下单用户。能够基于用户与客服的对话内容预测用户下单概率,从而根据当前用户所处场景来更准确地预测用户下单行为,可实时监测用户下单的可能性,准确识别潜在下单用户。在将当前用户识别为潜在下单用户的情况下,向当前用户展示特定的商品数据或服务数据,从而可针对性地向用户推荐商品或服务等数据。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明,不构成对本发明的不当限定。其中:

图1是根据本发明一个实施例的用户识别方法的主要步骤示意图;

图2是根据本发明一个实施例的用户下单概率预测流程示意图;

图3是根据本发明一个实施例的多层感知机模型结构示意图;

图4是根据本发明一个实施例的循环神经网络模型结构示意图;

图5是根据本发明一个实施例的下单概率模型结构示意图;

图6是根据本发明一个实施例的向用户展示数据的方法的主要步骤示意图;

图7是根据本发明一个实施例的用户识别装置的主要模块示意图;

图8是根据本发明一个实施例的向用户展示数据的装置的主要模块示意图;

图9是本发明实施例可以应用于其中的示例性系统架构图;

图10是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

图1是根据本发明一个实施例的用户识别方法的主要步骤示意图。

如图1所示,本发明一个实施例的用户识别方法主要包括如下的步骤s101至步骤s104。

步骤s101:获取当前用户的会话数据、行为轨迹数据、历史行为画像数据;

步骤s102:基于当前用户的会话数据、行为轨迹数据、历史行为画像数据构建当前用户的下单行为特征集;

步骤s103:将当前用户的下单行为特征集输入下单概率模型,以计算当前用户产生下单行为的概率值;

步骤s104:在计算出的概率值大于预设阈值的情况下,将当前用户识别为潜在下单用户。

当前用户即当前待预测其下单概率的用户,以识别其是否为潜在下单用户,潜在下单用户是当前具有下单潜力的用户。

在一个实施例中,基于当前用户的会话数据、行为轨迹数据、历史行为画像数据构建当前用户的下单行为特征集,包括:基于该会话数据构建当前用户的会话参数特征、用户文本特征、客服文本特征,基于该行为轨迹数据构建当前用户的行为轨迹特征,基于该历史行为画像数据构建当前用户的历史画像特征,该下单行为特征集包括上述的会话参数特征、用户文本特征、客服文本特征、行为轨迹特征、历史画像特征,这些特征均为与下单行为相关的特征,称为下单行为特征。

在一个实施例中,基于当前用户的会话数据构建当前用户的会话参数特征,包括:从当前用户的会话数据中提取会话时长(即当前会话已经进行的时间长度)、用户消息数(即用户的会话文本的数量)、客服消息数(即客服的会话文本的数量)、客服平均响应时长(即客服在会话中的平均响应时长)、用户平均响应时长(即用户在会话中的平均响应时长)、用户切出会话次数中的一种或多种信息,以构建得到当前用户的会话参数特征,其中,当前用户的会话数据为当前用户与当前会话的客服之间已产生的会话文本的集合。

用户切出会话次数为当前用户在当前会话中切换到其他操作的次数。其他操作是指会话以外的操作。例如,用户与客服当前会话时打开了一个会话窗口,在会话窗口关闭之前,当前会话一直存在,在此期间用户可以进行浏览商品等操作,使得会话窗口处于未激活的状态,用户在当前会话中进行一次浏览商品等操作,则视为用户切出会话一次,在进行完浏览商品等操作之后,用户切换回会话窗口,会话窗口再次激活,用户可以继续与客服会话,如果用户多次切出会话,那么用户切出会话次数累加,得到用户切出会话次数。

在一个实施例中,所述基于当前用户的行为轨迹数据构建当前用户的行为轨迹特征,包括:从所述当前用户的行为轨迹数据中提取当前用户的会话开始前商品点击记录(指示会话开始前是否点击商品)、会话开始前点击商品数、会话开始前点击同会话品类商品数(即在会话开始前对同一会话品类的商品的点击数,每一会话对应一个或多个品类)、关于点击商品是否包含会话携带商品参数的记录(指示点击的商品是否包含会话所携带的商品参数)、关于所述当前用户是否咨询其他客服的记录(指示当前用户是否咨询其他店铺的客服)中的一种或多种信息,以构建得到当前用户的行为轨迹特征,其中,当前用户的行为轨迹数据为当前用户在当前会话开始前的预设时间长度内一种或多种预设行为的轨迹数据。预设时间长度可根据需要设定。

在一个实施例中,基于当前用户的历史行为画像数据构建当前用户的历史画像特征,包括:从当前用户的历史行为画像数据中提取当前用户的预设时段内的下单数、咨询客服数、客单价(指每一位顾客平均购买商品金额)、咨询下单比(即咨询数与下单数的比值)中的一种或多种信息,以构建得到当前用户的历史画像特征。预设时段可以根据需要设定具体时长。

在一个实施例中,基于多层感知机、第一循环神经网络、第二循环神经网络进行网络结构组合,得到下单概率模型,其中,多层感知机的输入为当前用户的会话参数特征、行为轨迹特征、历史画像特征,第一循环神经网络的输入为当前用户的用户文本特征,第二循环神经网络的输入为当前用户的客服文本特征。

第一循环神经网络、第二循环神经网络可以为相同或不同的循环神经网络。循环神经网络例如可采用lstm(长短期记忆网络)等。

在一个实施例中,在预设的触发条件下,获取当前用户的会话数据、行为轨迹数据、历史行为画像数据,以实时调用下单概率模型计算当前用户产生下单行为的概率值,其中,预设的触发条件为:当前生成一条当前用户的会话文本或当前生成一条与当前用户进行会话的客服的会话文本。一条会话文本即会话中的一条聊天语句,即每当当前用户或客服输入以及聊天语句,则触发调用一次下单概率模型,从而可以实时计算当前用户的下单概率,进而实时识别当前用户是否为潜在下单用户,以针对性地该当前用户提供服务。

本发明实施例的下单概率模型需要预先进行训练,训练过程包括:基于用户样本的历史会话数据样本、历史行为轨迹数据样本、历史行为画像数据样本,构建用户样本的下单行为特征样本集;根据从历史会话开始至历史会话结束后指定时间段内用户样本的下单记录,自动生成用户样本的下单标签,历史会话是历史会话数据样本所属的会话;利用用户样本的下单行为特征样本集和对应的下单标签,训练下单概率模型。

用户样本即训练阶段对应的用户,历史会话数据样本即训练阶段对应的用户的历史会话数据,历史行为轨迹数据样本即训练阶段对应的用户的历史行为轨迹数据,历史行为画像数据样本即训练阶段对应的用户的历史行为画像数据,下单行为特征样本集即训练阶段对应的用户的下单行为特征集。将下单行为特征样本集输入下单概率模型,以对应的下单标签作为训练目标,来训练下单概率模型,下单标签指示用户是否下单。

图2是根据本发明一个实施例的用户下单概率预测流程示意图。

如图2所示,本发明一个实施例的用户下单概率预测流程主要包括数据获取、特征构建、模型训练和下单预测四部分,通过数据获取和特征构建,得到模型训练样本和标签,以进行模型训练,模型即本发明实施例的下单概率模型。利用训练后的模型进行下单预测,即对下单概率进行预测,下面对各部分详细介绍。

数据获取,主要是针对用户样本进行历史会话数据抽取、用户行为轨迹挖掘、用户历史行为画像获取、用户下单标签生成。

历史会话数据抽取过程包括:筛选近半年有咨询过客服的顾客(即用户样本)所记录的会话对应的聊天文本内容,包括顾客与机器人对话的内容,顾客与人工客服对话的内容,以及会话相关参数,例如会话时长、消息数、客服平均响应时长等。通过历史会话数据抽取得到的数据即用户样本的历史会话数据样本。

对抽取的历史会话数据可以进行数据清洗,数据清洗例如可以包括过滤系统消息、订单信息、网页链接等信息。

用户行为轨迹挖掘过程包括:获取每通会话(即每一会话)接通前1小时内,顾客的行为轨迹,如浏览商品类型、浏览时间、是否咨询其他店铺等信息。通过用户行为轨迹挖掘得到的数据即用户样本的历史行为轨迹数据样本。

获取用户历史行为画像过程包括:获取用户样本的历史下单相关的数据,如1个月内下单数、1个月内咨询客服数、1年内下单数、客单价等。通过获取用户历史行为画像获得的是用户样本的历史行为画像数据样本。

下单标签生成过程包括:以上述所描述的会话为一个会话样本,统计从会话开始,至会话结束后1小时内,是否存在该顾客的下单记录,若存在,则标记该会话样本对应的下单标签为1,否则标记该会话样本对应的下单标签为0,以下单标签作为模型训练用的标签。若在会话过程中顾客产生了下单行为,则记录下单时刻之前顾客与客服对话的所有句子,舍弃下单后所产生的对话内容,作为该会话样本的训练特征,即,下单标签为1对应的用户样本,以下单时刻之前该用户样本与客服的会话数据作为该用户样本的部分历史会话数据样本,以便后续能更好地达到实时预测效果。同时需要随机增加一些会话未结束时产生的会话样本,并标记对应的下单标签为0,表征当前会话进行到的程度和状态是未发生下单行为,并将相应的会话数据加入到历史会话数据样本中。

本发明实施例基于是否有用户历史下单行为,可自动标注模型训练样本,无需人工标注,大大节省方案实施成本。

特征构建,主要是基于用户样本的历史会话数据样本、历史行为轨迹数据样本、历史行为画像数据样本,构建用户样本的下单行为特征样本集,即训练阶段所利用的下单行为特征集,具体可以分为结构化特征和非结构化特征。

首先介绍构建结构化特征的过程。

本发明实施例中结构化特征包括用户行为轨迹特征、用户画像特征(即历史画像特征)及会话参数特征,这些特征通常是用具体数字表征的特征。

用户行为特征基于会话开始前是否点击商品、会话开始前点击商品数、会话开始前点击同会话品类商品数、点击商品是否包含会话携带商品参数、是否咨询其他店铺客服等信息构建得到。

用户画像特征基于1个月内下单数、1个月内咨询客服数、1年内客单价、1年内咨询下单比等信息构建得到。

会话参数特征基于会话时长、顾客消息数、客服消息数、客服平均响应时长、顾客平均响应时长、顾客切出会话次数等信息构建得到。

以上特征可包括连续特征和离散特征,其中,连续特征需进行z-score(z值)标准化处理,以响应时长为例,z-score标准化处理过程包括:计算各响应时长总体的均值和标准差,对于任一响应时长,将该响应时长减去所计算出的均值,得到该响应时长与均值之差,再将该响应时长与均值之差除以所计算出的标准差,即得到了标准化之后的该响应时长,对于其他结构化特征的z-score标准化处理过程与上述过程相同,不再赘述。离散特征可按照出现的频数从高到低排序后,使用数字1~n进行编码,编码方式参见下文对文本的编码。

其次介绍构建非结构化特征的过程。

本发明实施例中非结构化特征具体指顾客和客服聊天文本内容信息,包括用户文本特征、客服文本特征。用户文本特征即由会话过程中用户的会话文本得到的特征,客服文本特征即由会话过程中客服的会话文本得到的特征。这些特征都属于文本特征,无法直接用具体数字表征。

文本特征构建具体方法如下:将训练集的所有语句按照字符进行拆分;统计所有字符的频率;按照字符频率从高到低依次从1开始编号,最多编号至9999;将所有顾客或客服的聊天文本连接组合为一条长文本;将每一条长文本文本转换为编码;定义长度为n1的向量,文本字符长度超过n1则截取前n1个字符,不足n1则补0。具体地,即:对于每一会话数据(历史会话数据样本),进行用户和客服标识,将用户的会话文本和客服的会话文本分别连接组合为一条长文本,即:对于每个会话数据,都生成两条长文本:其中一条是用户会话文本的长文本(由该用户的所有会话文本连接组合而成的长文本),另一条是客服会话文本的长文本(由该客服的所有会话文本连接组合而成的长文本)。将每一条长文本进行文本转换,即将文本中的各字符分别转换为上述的文本字符的编码(1~9999中的一个)。定义长度为n1的向量,如果向量中的文本字符长度超过n1,则截取前n1个字符,不足n1则补0。

模型训练,即利用上述得到的下单行为特征样本集训练下单概率模型。本发明实施例的下单概率模型为多输入单输出模型,具体包括五个输入:输入1~输入5,以及一个输出,下面分别介绍。

输入1:会话级结构化特征,即用户样本的会话参数特征,维度为(n2,m1),n为训练样本数,m1为特征数;

输入2:用户历史画像结构化特征,即用户样本的历史画像特征,维度为(n2,m2),n为训练样本数,m2为特征数

输入3:用户行为轨迹结构化特征,即用户样本的行为轨迹特征,维度为(n2,m3),n为训练样本数,m3为特征数

输入4:用户会话文本向量,即用户样本的用户文本特征,维度为(n2,k1),n2为训练样本数,k1=n1为文本编码长度

输入5:客服会话文本向量,即与用户样本会话的客服的客服文本特征,维度为(n2,k2),n2为训练样本数,k2=n1为文本编码长度

输出:是否下单,0或1,共2个类别,并进行one-hot(独热编码)处理。

本发明实施例的下单概率模型采用基于多层感知机(mlp)、两个循环神经网络得到的自定义模型结构。

多层感知机对上述的输入1、输入2、输入3所描述的结构化特征,使用多层感知机算法构建模型,模型结构如图3所示,包括输入层、隐藏层、输出层,多层感知机层与层之间是全连接的,即上一层的任何一个神经元与下一层的所有神经元都有连接。

循环神经网络用于对于输入4或输入5,采用循环神经网络(例如lstm算法)构建模型,模型结构如图4所示,可以包括输入层、嵌入层、第一双向lstm、第二双向lstm、最大池化层、平均池化层、连接层、隐藏层、标准化层、丢弃层(dropout层)、输出层,其中,第一双向lstm与第二双向lstm级联。

通过对多层感知机、两个循环神经网络进行网络连接,即对mlp和lstm网络结构进行组合,得到本发明实施例的下单概率模型,如图5所示,其中,输入多层感知机的结构化特征包括:会话参数特征、历史画像特征、行为轨迹特征。

下单概率预测阶段,可以实时对用户的下单概率进行预测。在当前用户接通人工客服会话后,实时获取当前用户与客服的会话数据,当前用户或客服每发送一句话,则本发明实施例的服务器可以调用一次下单概率预测模型,输入当前会话发生前的当前用户的行为轨迹特征和该当前用户的历史画像特征,同时输入该当前用户的会话参数特征以及对应的用户文本特征和客服文本特征,下单概率预测模型实时输出预测得到的该当前用户的下单概率值。当概率值达到预设阈值(例如50%或以上)时,说明当前用户具备下单潜力,即为潜在下单用户,那么,客服可针对性地对该当前用户进行服务,具体向当前用户展示特定的商品数据或服务数据,例如推荐店铺热门商品,或推荐用户咨询相关产品等。

通过顾客在电商平台购物过程中,咨询了客服且在一定时间内有过下单购买的行为,以当前咨询客服前后的行为轨迹以及与客服会话内容作为特征,通过深度学习模型,训练下单概率模型。在实际应用系统中,可在顾客咨询客服的过程中,实时调用下单概率模型,返回顾客下单概率值,有助于客服实时掌握顾客购买状态,针对性的进行客服服务,提高识别潜在下单用户的准确性,并提高数据推荐的针对性,一定程度上提高了商品转化率。

图6是根据本发明一个实施例的向用户展示数据的方法的主要步骤示意图。

如图6所示,本发明一个实施例的向用户展示数据的方法主要包括如下的步骤s601至步骤s605。其中,步骤s601至步骤s604分别与步骤s101至步骤s104对应相同,具体参见上文对步骤s101至步骤s104的介绍。

步骤s605:在将当前用户识别为潜在下单用户的情况下,向当前用户展示特定的商品数据或服务数据。

图7是根据本发明一个实施例的用户识别装置的主要模块示意图。

如图7所示,本发明一个实施例的用户识别装置700主要包括:数据获取模块701、特征构建模块702、概率计算模块703、用户识别模块704。

数据获取模块701,用于获取当前用户的会话数据、行为轨迹数据、历史行为画像数据;

特征构建模块702,用于基于当前用户的会话数据、所述行为轨迹数据、所述历史行为画像数据构建所述当前用户的下单行为特征集;

概率计算模块703,用于将当前用户的下单行为特征集输入下单概率模型,以计算所述当前用户产生下单行为的概率值;

用户识别模块704,用于在计算出的概率值大于预设阈值的情况下,将所述当前用户识别为潜在下单用户。

在一个实施例中,特征构建模块702具体用于:基于当前用户的会话数据构建当前用户的会话参数特征、用户文本特征、客服文本特征,基于当前用户的行为轨迹数据构建当前用户的行为轨迹特征,基于当前用户的历史行为画像数据构建当前用户的历史画像特征,下单行为特征集包括会话参数特征、用户文本特征、客服文本特征、行为轨迹特征、历史画像特征。

在一个实施例中,特征构建模块702包括会话参数特征构建子模块,用于:从当前用户的会话数据中提取会话时长、用户消息数、客服消息数、客服平均响应时长、用户平均响应时长、用户切出会话次数中的一种或多种信息,以构建得到当前用户的会话参数特征,其中,当前用户的会话数据为当前用户与当前会话的客服之间已产生的会话文本的集合,用户切出会话次数为当前用户在当前会话中切换到其他操作的次数。

在一个实施例中,特征构建模块702包括行为轨迹特征构建子模块,用于:从当前用户的行为轨迹数据中提取当前用户的会话开始前商品点击记录、会话开始前点击商品数、会话开始前点击同会话品类商品数、关于点击商品是否包含会话携带商品参数的记录、关于当前用户是否咨询其他客服的记录中的一种或多种信息,以构建得到当前用户的行为轨迹特征,其中,当前用户的行为轨迹数据为当前用户在当前会话开始前的预设时间长度内一种或多种预设行为的轨迹数据。

在一个实施例中,特征构建模块702包括历史画像特征构建子模块,用于:从当前用户的历史行为画像数据中提取当前用户的预设时段内的下单数、咨询客服数、客单价、咨询下单比中的一种或多种信息,以构建得到当前用户的历史画像特征。

在一个实施例中,用户识别装置700还包括模型建立模块,用于基于多层感知机、第一循环神经网络、第二循环神经网络进行网络结构组合,得到下单概率模型,其中,多层感知机的输入为会话参数特征、行为轨迹特征、历史画像特征,第一循环神经网络的输入为用户文本特征,第二循环神经网络的输入为客服文本特征。

在一个实施例中,数据获取模块701具体用于:在预设的触发条件下,获取当前用户的会话数据、行为轨迹数据、历史行为画像数据,以实时调用下单概率模型计算当前用户产生下单行为的概率值,其中,预设的触发条件为:当前生成一条当前用户的会话文本或当前生成一条与当前用户进行会话的客服的会话文本。

用户识别装置700还可以包括模型训练模块,用于:基于用户样本的历史会话数据样本、历史行为轨迹数据样本、历史行为画像数据样本,构建用户样本的下单行为特征样本集;根据从历史会话开始至历史会话结束后指定时间段内用户样本的下单记录,自动生成用户样本的下单标签,历史会话是历史会话数据样本所属的会话;利用用户样本的下单行为特征样本集和对应的下单标签,训练下单概率模型。

图8是根据本发明一个实施例的向用户展示数据的装置的主要模块示意图。

本发明一个实施例的向用户展示数据的装置800主要包括:数据获取模块801、特征构建模块802、概率计算模块803、用户识别模块804、数据展示模块805。

其中,数据获取模块801、特征构建模块802、概率计算模块803、用户识别模块804分别与上文介绍的数据获取模块701、特征构建模块702、概率计算模块703、用户识别模块704功能相同,此处不再赘述。

数据展示模块805,用于在将当前用户识别为潜在下单用户的情况下,向当前用户展示特定的商品数据或服务数据。

另外,在本发明实施例中所述用户识别装置、向用户展示数据的装置的具体实施内容,在上面所述用户识别方法、向用户展示数据的方法中已经详细说明了,故在此重复内容不再说明。

图9示出了可以应用本发明实施例的用户识别方法、向用户展示数据的方法或用户识别装置、向用户展示数据的装置的示例性系统架构900。

如图9所示,系统架构900可以包括终端设备901、902、903,网络904和服务器905。网络904用以在终端设备901、902、903和服务器905之间提供通信链路的介质。网络904可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备901、902、903通过网络904与服务器905交互,以接收或发送消息等。终端设备901、902、903上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。

终端设备901、902、903可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器905可以是提供各种服务的服务器,例如对用户利用终端设备901、902、903所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。

需要说明的是,本发明实施例所提供的用户识别方法、向用户展示数据的方法一般由服务器905执行,相应地,用户识别装置、向用户展示数据的装置一般设置于服务器905中。

应该理解,图9中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

下面参考图10,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统1000的结构示意图。图10示出的终端设备或服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图10所示,计算机系统1000包括中央处理单元(cpu)1001,其可以根据存储在只读存储器(rom)1002中的程序或者从存储部分1008加载到随机访问存储器(ram)1003中的程序而执行各种适当的动作和处理。在ram1003中,还存储有系统1000操作所需的各种程序和数据。cpu1001、rom1002以及ram1003通过总线1004彼此相连。输入/输出(i/o)接口1005也连接至总线1004。

以下部件连接至i/o接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至i/o接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。

特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(cpu)1001执行时,执行本申请的系统中限定的上述功能。

需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括数据获取模块、特征构建模块、概率计算模块、用户识别模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,数据获取模块还可以被描述为“用于获取当前用户的会话数据、行为轨迹数据、历史行为画像数据的模块”。

作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取当前用户的会话数据、行为轨迹数据、历史行为画像数据;基于所述会话数据、所述行为轨迹数据、所述历史行为画像数据构建所述当前用户的下单行为特征集;将所述下单行为特征集输入下单概率模型,以计算所述当前用户产生下单行为的概率值;在所述概率值大于预设阈值的情况下,将所述当前用户识别为潜在下单用户。

根据本发明实施例的技术方案,获取当前用户的会话数据、行为轨迹数据、历史行为画像数据,基于获取的会话数据、行为轨迹数据、历史行为画像数据构建当前用户的下单行为特征集,将当前用户的下单行为特征集输入下单概率模型,以计算当前用户产生下单行为的概率值,在概率值大于预设阈值的情况下,将当前用户识别为潜在下单用户。能够基于用户与客服的对话内容预测用户下单概率,从而根据当前用户所处场景来更准确地预测用户下单行为,可实时监测用户下单的可能性,准确识别潜在下单用户。在将当前用户识别为潜在下单用户的情况下,向当前用户展示特定的商品数据或服务数据,从而可针对性地向用户推荐商品或服务等数据。

上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1