本发明涉及智能推荐技术领域,尤其涉及一种基于多源数据的对象推送方法、装置、设备及存储介质。
背景技术:
目前,关于对象的推荐,评估人通常是根据目标对象的一些相关的属性,主观的对目标对象进行评估后进行推荐。例如,某保险公司对用户进行保单产品推送时,会根据用户的个人信息、历史保单等为依据根据评估后作出推荐,然而这种推荐并不能识别出恶意用户和欺诈用户,由于向恶意用户和欺诈用户也进行了推送,导致网络及系统资源的浪费,且现有的推送方案通常是基于某种预测算法进行,存在准确性不高、对系统性能的要求较高等技术问题。
技术实现要素:
鉴于以上内容,本发明提供一种基于多源数据的对象推送方法、装置、设备及存储介质,其目的在于解决现有技术中的对象推送导致系统资源浪费且推送准确度不高的技术问题。
为实现上述目的,本发明提供一种基于多源数据的对象推送方法,该方法包括:
从预定数据源获取用户的属性信息并构建该用户与预设用户群中用户的关系图谱,基于所述关系图谱判断所述用户是否属于预设类型用户,当判断所述用户不属于预设类型用户时,根据预先配置的埋点集获取所述用户在预设页面的操作轨迹;
利用第一算法计算所述用户的操作轨迹与参考操作轨迹的轨迹相似度,当所述轨迹相似度小于第一预设值时,将所述用户的属性信息输入预先确定的用户标签识别模型得到所述用户所属的标签;
获取所述用户所属的标签相关联的目标用户群,基于第二算法计算得到所述用户与所述目标用户群中各用户的相似度,获取相似度值最大的用户对应的对象并添加至预先配置的对象列表,将所述对象列表推送至所述用户。
优选的,所述基于所述关系图谱判断所述用户是否属于预设类型用户包括:
利用图算法计算在所述关系图谱中所述用户与预设类型用户的节点距离面的浏览信息,当所述节点距离小于第二预设值时,判断所述用户属于预设类型用户。
优选的,所述判断所述用户是否属于预设类型用户还包括:
当判断所述用户属于预设类型用户时,将所述用户的属性信息发送至预设用户端。
优选的,所述预先配置的埋点集的生成步骤包括:
a、随机在预设页面生成初始埋点集;
b、预设时间段后判断所述初始埋点集的准确率是否大于第三预设值,若是,将所述初始埋点集作为所述预设埋点集,否则执行步骤c;
c、依据适应度选择再生埋点,适应度高的埋点被选中的概率高,适应度低的埋点被淘汰;
d、按照一定的交叉概率和交叉方法,生成第一埋点集;
e、按照一定的变异概率和变异方法,生成第二埋点集;
f、将所述第一埋点集和所述第二埋点集作为新的初始埋点集,返回步骤b。
优选的,所述利用第一算法计算所述用户的操作轨迹与参考操作轨迹的轨迹相似度还包括:
当所述轨迹相似度大于或等于第一预设值时,向所述用户发出预设的提示信息。
优选的,所述方法还包括:
实时获取所述用户在预设页面的浏览信息,基于物品的协同过滤算法将与所述浏览信息相关的对象添加至所述对象列表。
优选的,所述方法还包括:
判断所述用户的属性信息中是否存在预设类型的目标对象,若存在,将所述目标对象输入预先确定的对象标签识别模型得到所述目标对象所属的标签,将所述目标对象所属的标签相关联的对象添加至所述对象列表。
为实现上述目的,本发明还提供一种基于多源数据的对象推送装置,该基于多源数据的对象推送装置包括:
获取模块:用于从预定数据源获取用户的属性信息并构建该用户与预设用户群中用户的关系图谱,基于所述关系图谱判断所述用户是否属于预设类型用户,当判断所述用户不属于预设类型用户时,根据预先配置的埋点集获取所述用户在预设页面的操作轨迹;
计算模块:用于利用第一算法计算所述用户的操作轨迹与参考操作轨迹的轨迹相似度,当所述轨迹相似度小于第一预设值时,将所述用户的属性信息输入预先确定的用户标签识别模型得到所述用户所属的标签;
推送模块:用于获取所述用户所属的标签相关联的目标用户群,基于第二算法计算得到所述用户与所述目标用户群中各用户的相似度,获取相似度值最大的用户对应的对象并添加至预先配置的对象列表,将所述对象列表推送至所述用户。
为实现上述目的,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的程序,所述程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的基于多源数据的对象推送方法的任意步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有基于多源数据的对象推送程序,所述基于多源数据的对象推送程序被处理器执行时,实现如上所述基于多源数据的对象推送方法的任意步骤。
本发明提出的基于多源数据的对象推送方法、装置、设备及存储介质,通过用户的属性信息及操作轨迹信息识别出用户是否属于欺诈用户或恶意用户,当用户不为欺诈用户和恶意用户时,再识别出用户的所属用户群,将用户群中与该用户的相似度最大用户的对象推送至该用户,提高了对象推送的针对性和准确性,避免因推送不准确而导致的系统及网络资源的浪费。
附图说明
图1为本发明基于多源数据的对象推送方法较佳实施例的流程图示意图;
图2为本发明基于多源数据的对象推送装置较佳实施例的模块示意图;
图3为本发明电子设备较佳实施例的示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种基于多源数据的对象推送方法。参照图1所示,为本发明基于多源数据的对象推送方法的实施例的方法流程示意图。该方法可以由一个电子设备执行,该电子设备可以由软件和/或硬件实现,该电子设备可以包括但不限于智能手机、个人计算机、笔记本电脑、平板电脑和便携式可穿戴设备等。基于多源数据的对象推送方法包括:
步骤s10:从预定数据源获取用户的属性信息并构建该用户与预设用户群中用户的关系图谱,基于所述关系图谱判断所述用户是否属于预设类型用户,当判断所述用户不属于预设类型用户时,根据预先配置的埋点集获取所述用户在预设页面的操作轨迹。
在本实施例中,以对象推送为保险领域保单产品推送为了对本方案进行说明,可以理解的是,本方案的具体应用场景并不限于保险领域的保单推送。从预定数据源获取用户的属性信息并构建该用户与预设用户群中用户的关系图谱,预定数据源可以是与用户相关的第三方数据库,预设用户群可以是多个预设类型用户(欺诈用户),其中,用户的属性信息包括用户的实名认证信息、社交关系网、银行征信信息、用户所在城市的欺诈用户的信息等,根据用户的属性信息构建关系图谱,关系图谱可以是指用户与欺诈用户的关系图谱。可以理解的是,埋点集可以是预先配置在应用程序客户端对应的程序代码中的多个数据埋点,每个数据埋点都是独立工作的,实际应用中可根据需求在客户端提供的不同服务所对应的关键操作流程的功能点中进行数据埋点的设置,从而通过埋点来记录用户的访问时间、操作对象、执行动作、操作描述等用户操作信息,通过操作信息可以获取用户在预设页面的操作轨迹,预设页面可以是应用程序客户端对应的多个页面,例如,对象的详情页面、订单页面、支付页面等等。
通过构建的关系图谱判断用户是否属于预设类型用户(即欺诈用户),当判断该用户不属于欺诈用户时,根据预设埋点集获取该用户的操作轨迹,用户的操作轨迹可以是指用户浏览页面时的操作轨迹信息。针对不同的操作对象,获取操作轨迹信息的频率可以不同,例如浏览页面的行为可以3分钟左右获取一次,涉及投保、支付等环节的操作时,可以30秒或更短时间获取一次。
在一个实施例中,所述基于所述关系图谱判断所述用户是否属于预设类型用户包括:
利用图算法计算在所述关系图谱中所述用户与预设类型用户的节点距离面的浏览信息,当所述节点距离小于第二预设值时,判断所述用户属于预设类型用户。
利用图算法计算该用户与欺诈用户的节点距离,当节点距离小于第二预设值时(第二预设值可以根据需求设置),判断该用户为欺诈用户。进一步地,还可以利用图算法获取最大联通子图排除与场景无关的用户,通过sql脚本组件和join组件去除关系图谱中的无关联人员,加快判断用户是否为欺诈用户的速度。
在一个实施例中,还可以利用单源最短路径算法,查找出该用户的直接人脉、间接人脉等关系,再获取黑名单库中涉嫌欺诈保单、欺诈贷款及被征信体系列入违约失信名单的用户信息数据,并通过sql脚本组件对结果进行筛选得到该用户涉嫌欺诈的概率。
进一步地,所述判断所述用户是否属于预设类型用户还包括:
当判断所述用户属于预设类型用户时,将所述用户的属性信息发送至预设用户端。当判断用户属于欺诈用户时,可以将用户的属性信息发送至预设用户端,启动人工审核机制对该用户的具体信息进行审核。
在一个实施例中,所述预先配置的埋点集的生成步骤包括:
a、随机在预设页面生成初始埋点集;
b、预设时间段后判断所述初始埋点集的准确率是否大于第三预设值,若是,将所述初始埋点集作为所述预设埋点集,否则执行步骤c;
c、依据适应度选择再生埋点,适应度高的埋点被选中的概率高,适应度低的埋点被淘汰;
d、按照一定的交叉概率和交叉方法,生成第一埋点集;
e、按照一定的变异概率和变异方法,生成第二埋点集;
f、将所述第一埋点集和所述第二埋点集作为新的初始埋点集,返回步骤b。
其中,交叉概率pc的计算公式包括:
变异概率pm的计算公式包括:
fmax表示埋点集中最大的适应度值,favg表示每代埋点集的平均适应度值,f/表示要交叉的两个埋点中较大的适应度值,f要变异的埋点的适应度值,pc1=0.9,pc2=0.6,pm1=0.1,pm2=0.001。
传统的数据埋点一般由业务需求出发,适当记录用户的操作信息,用于对不同类型用户的识别。由于这些埋点由于缺乏相应的对照,及后续效果的准确分析,在对用户的操作信息记录过程中会存在一定偏差,通过上述方法生成埋点集,可获取到合适的埋点集用于获取用户的操作轨迹信息。
步骤s20:利用第一算法计算所述用户的操作轨迹与参考操作轨迹的轨迹相似度,当所述轨迹相似度小于第一预设值时,将所述用户的属性信息输入预先确定的用户标签识别模型得到所述用户所属的标签。
在本实施例中,第一算法可以是离散弗雷歇距离算法,计算用户的操作轨迹与参考操作轨迹的轨迹之间距离,其中,参考操作轨迹是指敏感操作轨迹(例如,恶意用户的操作轨迹),轨迹之间距离越近则代表轨迹相似度越高,若用户操作轨迹与敏感操作轨迹相似度小于第一预设值,则判断该用户为正常用户,还可以记录该用户的成交操作轨迹。
假设用户的操作轨迹为p且长度为n,敏感轨迹为q且长度为m,两者运动位置的可以用一个t变量的连续递增函数来刻画,采用α(t)来表示用户操作轨迹的描述函数,β(t)表示敏感轨迹位置的描述函数,将变量t约束到区间[0,1]内,对于每一对可能的描述函数α(t)和β(t)总能找到整个运动过程中两者最长的距离,通过改变α(t)和β(t)可使得这个最长的距离达到最小,这个最小的距离即为离散弗雷歇距离,计算公式如下:
之后,将该用户的属性信息输入预先确定的用户标签识别模型得到所述用户所属的标签。用户标签识别模型可以通过文本挖掘算法处理用户基本信息、历史交易、持有产品、收入支出等,聚类计算后得到具有人口属性、账户历史趋势、产品购买次数等信息的用户标签识别模型。例如,标签集可能包括服务敏感标签、价格敏感标签、线上投保偏好等标签,用户标签用于归类用户所属的用户群体。
在一个实施例中,所述利用第一算法计算所述用户的操作轨迹与参考操作轨迹的轨迹相似度还包括:
当所述轨迹相似度大于或等于第一预设值时,向所述用户发出预设的提示信息。进一步地,如果在预设时间段内,用户的多条操作轨迹与参考操作轨迹的相似度都比较高,则可以判断该用户为恶意用户,向用户发送操作频繁、操作敏感等信息提示,阻断用户持续的敏感操作,并在该用户后续的投保、报价等行为接入更多人工审核的环节。
步骤s30:获取所述用户所属的标签相关联的目标用户群,基于第二算法计算得到所述用户与所述目标用户群中各用户的相似度,获取相似度值最大的用户对应的对象并添加至预先配置的对象列表,将所述对象列表推送至所述用户。
在本实施例中,获取该用户所属的标签相关联的目标用户群,例如,用户所属标签是价格敏感标签,则目标用户群是对价格敏感的用户群,根据第二算法(例如,余弦相似度算法)计算得到该用户与目标用户群中各用户的相似度,获取相似度值最大的用户对应的对象(即相似度值最大的用户喜欢或购买的保单产品),并添加至预先配置的对象列表,对象在本实施例中可以是指保单产品。
例如,若用户u购买了产品a,b,c,用户v购买了a,b,c,e,f,则用户u与用户v的相似度的计算公式为:
用户u对保单产品的喜欢程度的计算公式包括:
其中,p(u,j)表示用户u对保单产品i的兴趣值,s(u,k)表示和用户u最相似的k个用户,n(i)表示对保单产品i产生过行为的用户集合,r(v,i)表示用户v对保单产品i是否产生过行为(收藏、咨询等行为)。
将用户u对保单产品j的兴趣值进行由大到小进行排序,选取相似度值最大的用户对应的预设数量的对象添加对象列表中,再将对象列表推送至所述用户。
进一步地,考虑两个用户对冷门产品采取过同样的行为,更能说明他们兴趣的相似,因此计算用户u与用户v的相似度时,还可以采用以下计算公式:
其中,n(i)表示对保单产品i产生过行为的用户的数量,n(u)表示用户u产生过行为的保单产品的数量,n(v)表示用户u产生过行为的保单产品的数量,w(u,v)表示用户u与用户v的相似度。
在一个实施例中,所述方法还包括:
实时获取所述用户在预设页面的浏览信息,基于物品的协同过滤算法将与所述浏览信息相关的对象添加至所述对象列表。可以在用户浏览过程中,得到用户感兴趣的对象并添加至对象列表。
在一个实施例中,所述方法还包括:
判断所述用户的属性信息中是否存在预设类型的目标对象,若存在,将所述目标对象输入预先确定的对象标签识别模型得到所述目标对象所属的标签,将所述目标对象所属的标签相关联的对象添加至所述对象列表。
对象标签识别模型可以通过文本挖掘算法处理对象的基本信息、历史交易信息等,聚类计算后得到具有对象属性、对象的交易历史趋势、购买次数等信息的对象标签识别模型。预设类型的目标对象可以是指用户购买过的保单产品,将购买过的保单产品输入对象标签识别模型得到其标签,将用户购买过的保单产品所属的标签相关联的对象添加至对象列表。
进一步地,还可以利用tf-idf算法计算所述用户在预设类型的目标对象成交过程中各标签所占比重,将比重最高的标签对应的产品推送至所述用户。比重大小将初步决定保单产品初始推荐的优先级别,例如,价格敏感标签的比重较高,则优先推荐性价比高、适合该用户的保单产品。
具体地,标签的比重=预设的行为类型权重*时间衰减*tf-idf计算的标签重要度*行为次数,其中,tf=该标签标记该保单的次数/该保单全部标签个数,idf=全部保单个数/包含标记该保单的标签的总保单数。
参照图2所示,为本发明基于多源数据的对象推送装置100的功能模块示意图。
本发明所述基于多源数据的对象推送装置100可以安装于电子设备中。根据实现的功能,所述基于多源数据的对象推送装置100可以包括获取模块110、计算模块120及推送模块130。本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
获取模块110,用于从预定数据源获取用户的属性信息并构建该用户与预设用户群中用户的关系图谱,基于所述关系图谱判断所述用户是否属于预设类型用户,当判断所述用户不属于预设类型用户时,根据预先配置的埋点集获取所述用户在预设页面的操作轨迹。
在本实施例中,以对象推送为保险领域保单产品推送为了对本方案进行说明,可以理解的是,本方案的具体应用场景并不限于保险领域的保单推送。从预定数据源获取用户的属性信息并构建该用户与预设用户群中用户的关系图谱,预定数据源可以是与用户相关的第三方数据库,预设用户群可以是多个预设类型用户(欺诈用户),其中,用户的属性信息包括用户的实名认证信息、社交关系网、银行征信信息、用户所在城市的欺诈用户的信息等,根据用户的属性信息构建关系图谱,关系图谱可以是指用户与欺诈用户的关系图谱。可以理解的是,埋点集可以是预先配置在应用程序客户端对应的程序代码中的多个数据埋点,每个数据埋点都是独立工作的,实际应用中可根据需求在客户端提供的不同服务所对应的关键操作流程的功能点中进行数据埋点的设置,从而通过埋点来记录用户的访问时间、操作对象、执行动作、操作描述等用户操作信息,通过操作信息可以获取用户在预设页面的操作轨迹,预设页面可以是应用程序客户端对应的多个页面,例如,对象的详情页面、订单页面、支付页面等等。
通过构建的关系图谱判断用户是否属于预设类型用户(即欺诈用户),当判断该用户不属于欺诈用户时,根据预设埋点集获取该用户的操作轨迹,用户的操作轨迹可以是指用户浏览页面时的操作轨迹信息。针对不同的操作对象,获取操作轨迹信息的频率可以不同,例如浏览页面的行为可以3分钟左右获取一次,涉及投保、支付等环节的操作时,可以30秒或更短时间获取一次。
在一个实施例中,所述基于所述关系图谱判断所述用户是否属于预设类型用户包括:
利用图算法计算在所述关系图谱中所述用户与预设类型用户的节点距离面的浏览信息,当所述节点距离小于第二预设值时,判断所述用户属于预设类型用户。
利用图算法计算该用户与欺诈用户的节点距离,当节点距离小于第二预设值时(第二预设值可以根据需求设置),判断该用户为欺诈用户。进一步地,还可以利用图算法获取最大联通子图排除与场景无关的用户,通过sql脚本组件和join组件去除关系图谱中的无关联人员,加快判断用户是否为欺诈用户的速度。
在一个实施例中,还可以利用单源最短路径算法,查找出该用户的直接人脉、间接人脉等关系,再获取黑名单库中涉嫌欺诈保单、欺诈贷款及被征信体系列入违约失信名单的用户信息数据,并通过sql脚本组件对结果进行筛选得到该用户涉嫌欺诈的概率。
进一步地,所述判断所述用户是否属于预设类型用户还包括:
当判断所述用户属于预设类型用户时,将所述用户的属性信息发送至预设用户端。当判断用户属于欺诈用户时,可以将用户的属性信息发送至预设用户端,启动人工审核机制对该用户的具体信息进行审核。
在一个实施例中,所述预先配置的埋点集的生成步骤包括:
a、随机在预设页面生成初始埋点集;
b、预设时间段后判断所述初始埋点集的准确率是否大于第三预设值,若是,将所述初始埋点集作为所述预设埋点集,否则执行步骤c;
c、依据适应度选择再生埋点,适应度高的埋点被选中的概率高,适应度低的埋点被淘汰;
d、按照一定的交叉概率和交叉方法,生成第一埋点集;
e、按照一定的变异概率和变异方法,生成第二埋点集;
f、将所述第一埋点集和所述第二埋点集作为新的初始埋点集,返回步骤b。
其中,交叉概率pc的计算公式包括:
变异概率pm的计算公式包括:
fmax表示埋点集中最大的适应度值,favg表示每代埋点集的平均适应度值,f/表示要交叉的两个埋点中较大的适应度值,f要变异的埋点的适应度值,pc1=0.9,pc2=0.6,pm1=0.1,pm2=0.001。
传统的数据埋点一般由业务需求出发,适当记录用户的操作信息,用于对不同类型用户的识别。由于这些埋点由于缺乏相应的对照,及后续效果的准确分析,在对用户的操作信息记录过程中会存在一定偏差,通过上述方法生成埋点集,可获取到合适的埋点集用于获取用户的操作轨迹信息。
计算模块120,用于利用第一算法计算所述用户的操作轨迹与参考操作轨迹的轨迹相似度,当所述轨迹相似度小于第一预设值时,将所述用户的属性信息输入预先确定的用户标签识别模型得到所述用户所属的标签。
在本实施例中,第一算法可以是离散弗雷歇距离算法,计算用户的操作轨迹与参考操作轨迹的轨迹之间距离,其中,参考操作轨迹是指敏感操作轨迹(例如,恶意用户的操作轨迹),轨迹之间距离越近则代表轨迹相似度越高,若用户操作轨迹与敏感操作轨迹相似度小于第一预设值,则判断该用户为正常用户,还可以记录该用户的成交操作轨迹。
假设用户的操作轨迹为p且长度为n,敏感轨迹为q且长度为m,两者运动位置的可以用一个t变量的连续递增函数来刻画,采用α(t)来表示用户操作轨迹的描述函数,β(t)表示敏感轨迹位置的描述函数,将变量t约束到区间[0,1]内,对于每一对可能的描述函数α(t)和β(t)总能找到整个运动过程中两者最长的距离,通过改变α(t)和β(t)可使得这个最长的距离达到最小,这个最小的距离即为离散弗雷歇距离,计算公式如下:
之后,将该用户的属性信息输入预先确定的用户标签识别模型得到所述用户所属的标签。用户标签识别模型可以通过文本挖掘算法处理用户基本信息、历史交易、持有产品、收入支出等,聚类计算后得到具有人口属性、账户历史趋势、产品购买次数等信息的用户标签识别模型。例如,标签集可能包括服务敏感标签、价格敏感标签、线上投保偏好等标签,用户标签用于归类用户所属的用户群体。
在一个实施例中,所述利用第一算法计算所述用户的操作轨迹与参考操作轨迹的轨迹相似度还包括:
当所述轨迹相似度大于或等于第一预设值时,向所述用户发出预设的提示信息。进一步地,如果在预设时间段内,用户的多条操作轨迹与参考操作轨迹的相似度都比较高,则可以判断该用户为恶意用户,向用户发送操作频繁、操作敏感等信息提示,阻断用户持续的敏感操作,并在该用户后续的投保、报价等行为接入更多人工审核的环节。
推送模块130,用于获取所述用户所属的标签相关联的目标用户群,基于第二算法计算得到所述用户与所述目标用户群中各用户的相似度,获取相似度值最大的用户对应的对象并添加至预先配置的对象列表,将所述对象列表推送至所述用户。
在本实施例中,获取该用户所属的标签相关联的目标用户群,例如,用户所属标签是价格敏感标签,则目标用户群是对价格敏感的用户群,根据第二算法(例如,余弦相似度算法)计算得到该用户与目标用户群中各用户的相似度,获取相似度值最大的用户对应的对象(即相似度值最大的用户喜欢或购买的保单产品),并添加至预先配置的对象列表,对象在本实施例中可以是指保单产品。
例如,若用户u购买了产品a,b,c,用户v购买了a,b,c,e,f,则用户u与用户v的相似度的计算公式为:
用户u对保单产品的喜欢程度的计算公式包括:
其中,p(u,j)表示用户u对保单产品i的兴趣值,s(u,k)表示和用户u最相似的k个用户,n(i)表示对保单产品i产生过行为的用户集合,r(v,i)表示用户v对保单产品i是否产生过行为(收藏、咨询等行为)。
将用户u对保单产品j的兴趣值进行由大到小进行排序,选取相似度值最大的用户对应的预设数量的对象添加对象列表中,再将对象列表推送至所述用户。
进一步地,考虑两个用户对冷门产品采取过同样的行为,更能说明他们兴趣的相似,因此计算用户u与用户v的相似度时,还可以采用以下计算公式:
其中,n(i)表示对保单产品i产生过行为的用户的数量,n(u)表示用户u产生过行为的保单产品的数量,n(v)表示用户u产生过行为的保单产品的数量,w(u,v)表示用户u与用户v的相似度。
在一个实施例中,所述推送模块还用于:
实时获取所述用户在预设页面的浏览信息,基于物品的协同过滤算法将与所述浏览信息相关的对象添加至所述对象列表。可以在用户浏览过程中,得到用户感兴趣的对象并添加至对象列表。
在一个实施例中,所述推送模块还用于:
判断所述用户的属性信息中是否存在预设类型的目标对象,若存在,将所述目标对象输入预先确定的对象标签识别模型得到所述目标对象所属的标签,将所述目标对象所属的标签相关联的对象添加至所述对象列表。
对象标签识别模型可以通过文本挖掘算法处理对象的基本信息、历史交易信息等,聚类计算后得到具有对象属性、对象的交易历史趋势、购买次数等信息的对象标签识别模型。预设类型的目标对象可以是指用户购买过的保单产品,将购买过的保单产品输入对象标签识别模型得到其标签,将用户购买过的保单产品所属的标签相关联的对象添加至对象列表。
进一步地,还可以利用tf-idf算法计算所述用户在预设类型的目标对象成交过程中各标签所占比重,将比重最高的标签对应的产品推送至所述用户。比重大小将初步决定保单产品初始推荐的优先级别,例如,价格敏感标签的比重较高,则优先推荐性价比高、适合该用户的保单产品。
具体地,标签的比重=预设的行为类型权重*时间衰减*tf-idf计算的标签重要度*行为次数,其中,tf=该标签标记该保单的次数/该保单全部标签个数,idf=全部保单个数/包含标记该保单的标签的总保单数。
参照图3所示,为本发明电子设备1较佳实施例的示意图。
该电子设备1包括但不限于:存储器11、处理器12、显示器13及网络接口14。所述电子设备1通过网络接口14连接网络,获取原始数据。其中,所述网络可以是企业内部网(intranet)、互联网(internet)、全球移动通讯系统(globalsystemofmobilecommunication,gsm)、宽带码分多址(widebandcodedivisionmultipleaccess,wcdma)、4g网络、5g网络、蓝牙(bluetooth)、wi-fi、通话网络等无线或有线网络。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述电子设备1的内部存储单元,例如该电子设备1的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述电子设备1的外部存储设备,例如该电子设备1配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,所述存储器11还可以既包括所述电子设备1的内部存储单元也包括其外部存储设备。本实施例中,存储器11通常用于存储安装于所述电子设备1的操作系统和各类应用软件,例如基于多源数据的对象推送程序10的程序代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器12在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的总体操作,例如执行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行基于多源数据的对象推送程序10的程序代码等。
显示器13可以称为显示屏或显示单元。在一些实施例中显示器13可以是led显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(organiclight-emittingdiode,oled)触摸器等。显示器13用于显示在电子设备1中处理的信息以及用于显示可视化的工作界面,例如显示数据统计的结果。
网络接口14可选地可以包括标准的有线接口、无线接口(如wi-fi接口),该网络接口14通常用于在所述电子设备1与其它电子设备之间建立通信连接。
图3仅示出了具有组件11-14以及基于多源数据的对象推送程序10的电子设备1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,所述电子设备1还可以包括用户接口,用户接口可以包括显示器(display)、输入单元比如键盘(keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(organiclight-emittingdiode,oled)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
该电子设备1还可以包括射频(radiofrequency,rf)电路、传感器和音频电路等等,在此不再赘述。
在上述实施例中,处理器12执行存储器11中存储的基于多源数据的对象推送程序10时可以实现如下步骤:
从预定数据源获取用户的属性信息并构建该用户与预设用户群中用户的关系图谱,基于所述关系图谱判断所述用户是否属于预设类型用户,当判断所述用户不属于预设类型用户时,根据预先配置的埋点集获取所述用户在预设页面的操作轨迹;
利用第一算法计算所述用户的操作轨迹与参考操作轨迹的轨迹相似度,当所述轨迹相似度小于第一预设值时,将所述用户的属性信息输入预先确定的用户标签识别模型得到所述用户所属的标签;
获取所述用户所属的标签相关联的目标用户群,基于第二算法计算得到所述用户与所述目标用户群中各用户的相似度,获取相似度值最大的用户对应的对象并添加至预先配置的对象列表,将所述对象列表推送至所述用户。
所述存储设备可以为电子设备1的存储器11,也可以为与电子设备1通讯连接的其它存储设备。
关于上述步骤的详细介绍,请参照上述图2关于基于多源数据的对象推送装置100实施例的功能模块图以及图1关于基于多源数据的对象推送方法实施例的流程图的说明。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质可以是非易失性的,也可以是易失性的。该计算机可读存储介质可以是硬盘、多媒体卡、sd卡、闪存卡、smc、只读存储器(rom)、可擦除可编程只读存储器(eprom)、便携式紧致盘只读存储器(cd-rom)、usb存储器等等中的任意一种或者几种的任意组合。所述计算机可读存储介质中包括存储数据区和存储程序区,存储数据区存储根据区块链节点的使用所创建的数据,存储程序区存储有基于多源数据的对象推送程序10,所述基于多源数据的对象推送程序10被处理器执行时实现如下操作:
从预定数据源获取用户的属性信息并构建该用户与预设用户群中用户的关系图谱,基于所述关系图谱判断所述用户是否属于预设类型用户,当判断所述用户不属于预设类型用户时,根据预先配置的埋点集获取所述用户在预设页面的操作轨迹;
利用第一算法计算所述用户的操作轨迹与参考操作轨迹的轨迹相似度,当所述轨迹相似度小于第一预设值时,将所述用户的属性信息输入预先确定的用户标签识别模型得到所述用户所属的标签;
获取所述用户所属的标签相关联的目标用户群,基于第二算法计算得到所述用户与所述目标用户群中各用户的相似度,获取相似度值最大的用户对应的对象并添加至预先配置的对象列表,将所述对象列表推送至所述用户。
本发明之计算机可读存储介质的具体实施方式与上述基于多源数据的对象推送方法的具体实施方式大致相同,在此不再赘述。
在另一个实施例中,本发明所提供的基于多源数据的对象推送方法,为进一步保证上述所有出现的数据的私密和安全性,上述所有数据还可以存储于一区块链的节点中。例如用户的操作轨迹及推荐列表等,这些数据均可存储在区块链节点中。
需要说明的是,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,电子装置,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。