一种基于用户场景的数据处理方法和装置的制造方法_4

文档序号:8339753阅读:来源:国知局
,根据聚类结果中具有显著性的属性特征确定用户当前所处的场景信息。例如,在演唱会开场的情形下,对聚集来听演唱会的听众而言,对“用户的当前位置X年龄X用户η个小时前的位置”这几个属性特征进行聚类,能够确定这些听众在当前的位置,他们或她们的行为路径(最近η个小时才到达当前位置),用户的年龄属性特征,这些特征组合上聚类比较集中,具有显著性,能够确定这些听众所处场景为听演唱会。但同一时间从路上走过或演唱会会场的工作人员因为属性(年龄区间等)或行为路径(最近η个小时到达)上的不同而不会被考虑到聚类中。又例如,机场中刚刚到达的乘客,和打算离开的乘客也会因为他们或她们的在预定时间段内轨迹特征上的不同(例如,预定时间段内位置属性特征)而被聚集成不同的聚类。又例如,对于学校、工厂等的用户群,根据用户的学历、年龄、职业等数个属性特征进行聚类,确定出具有显著性的几个属性特征,基于具有显著性的这些特征可以确定用户所处的场景确定为在上学、在工厂上班。学校中的老师因为年龄等属性特征而不会被确定为在上学的场景。
[0047]处理模块202的用户场景信息确定过程中,还可以根据外部数据确定用户当前所处的场景信息,例如,外部数据可包括该用户的搜索数据、社交网页数据(例如,用户的推特、微博、微信等社交网页上的文本数据或图片数据等)。例如,通过一个用户在社交网页上的文本数据或图片数据,可确定所有处于当前场景的用户所共同关心的信息。
[0048]处理模块202确定出用户当前所处的场景信息,接下来,发送模块203向该用户发送与当前所处的场景信息关联的消息。例如,在确定用户在机场刚刚下飞机的场景之后,可以向该用户发送机场便捷打车的关联消息或机场周围餐饮、住宿的消息等。又例如,在确定用户在餐馆等待就餐的场景下,可以向该用户发送推荐的菜肴关联的消息。
[0049]用户的各个场景类似于一个状态机的各个状态,用户在各个场景随着时间进行转换。本发明的处理模块202还可以包括根据用户当前所处的场景信息与该用户的场景转换历史确定该用户的下一个场景信息。用户的场景信息受到不同场景之间转换的影响。用户的场景之间并不是孤立存在的,例如,看完演唱会的演出之后,用户人群的下一个场景可以是回家的路上。吃饭场景之前的场景可能是逛街或者看电影。用户当前所处的场景具有一定的概率分布。根据一定时间段内用户场景转换的历史数据可以获得用户在各个场景的概率值,结合用户当前所处的场景信息,可以确定用户的下一个场景,可以是概率值较高的几个场景。那么,相应地,发送模块203可以根据确定出与当前所处场景关联(例如,下一个场景所需)的消息。这样的消息发送方式,给用户的下一步规划提供了有效的建议。
[0050]通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对【背景技术】做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,智能手机或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
[0051]本发明说明书中使用的术语和措辞仅仅为了举例说明,并不意味构成限定。本领域技术人员应当理解,在不脱离所公开的实施方式的基本原理的前提下,对上述实施方式中的各细节可进行各种变化。因此,本发明的范围只由权利要求确定,在权利要求中,除非另有说明,所有的术语应按最宽泛合理的意思进行理解。
【主权项】
1.一种基于用户场景的数据处理方法,其特征在于,包括; 获取用户在预定时间段内的轨迹数据,所述轨迹数据包括一个以上三元组(用户,时间,位置),其中,三元组中各元素均具有一个或一个以上属性特征; 根据所述三元组中各元素的一个或一个以上属性特征对所述轨迹数据聚类,并根据聚类结果中具有显著性的属性特征确定所述用户当前所处的场景信息; 向所述用户发送与当前所处的场景信息关联的消息。
2.根据权利要求1所述的方法,其特征在于,所述三元组中的时间为所述预定时间段内的一个时间点,位置为该用户在所述一个时间点所在的位置,并且所述轨迹数据包括该用户到达当前位置的时间点。
3.根据权利要求1所述的方法,其特征在于, 所述三元组(用户,时间,位置)中的用户元素具有下述一个或一个以上属性特征:性别、年龄、职业、收人、学历、身高、体重、民族、国籍、就业状态、婚姻状态; 所述三元组(用户,时间,位置)中的时间元素具有下述一个或一个以上属性特征:早晨、中午、下午、晚上、工作日、节假日; 所述三元组(用户,时间,位置)中的位置元素具有下述一个或一个以上属性特征:一个或多个兴趣点PO1、各兴趣点POI的类别、各兴趣点POI的价位、移动速度、停留时间。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述方法进一步包括: 根据外部数据确定所述用户当前所处的场景信息,其中,所述外部数据包括下述的一种或一种以上:该用户的搜索数据、社交网页数据。
5.根据权利要求1至3中任意一项所述的方法,其特征在于,所述方法进一步包括: 根据所述用户当前所处的场景信息和所述用户的场景转换历史确定所述用户的下一个场景信息。
6.一种基于用户场景的数据处理装置,其特征在于,包括: 获取模块,用于: 获取用户在预定时间段内的轨迹数据,所述轨迹数据包括一个以上三元组(用户,时间,位置),其中,三元组中各元素均具有一个或一个以上属性特征; 处理模块,用于根据所述三元组中各元素的一个或一个以上属性特征对所述轨迹数据聚类,并根据聚类结果中具有显著性的属性特征确定所述用户当前所处的场景信息; 发送模块,用于向所述用户发送与当前所处的场景信息关联的消息。
7.根据权利要求6所述的装置,其特征在于,所述三元组中的时间为所述预定时间段内的一个时间点,位置为该用户在所述一个时间点所在的位置,并且所述轨迹数据包括该用户到达当前位置的时间点。
8.根据权利要求6所述的装置,其特征在于, 所述三元组(用户,时间,位置)中的用户元素具有下述一个或一个以上属性特征:性别、年龄、职业、收人、学历、身高、体重、民族、国籍、就业状态、婚姻状态; 所述三元组(用户,时间,位置)中的时间元素具有下述一个或一个以上属性特征:早晨、中午、下午、晚上、工作日、节假日; 所述三元组(用户,时间,位置)中的位置元素具有下述一个或一个以上属性特征:一个或多个兴趣点PO1、各兴趣点POI的类别、各兴趣点POI的价位、移动速度、停留时间。
9.根据权利要求6至8中任意一项所述的装置,其特征在于,所述处理模块,还用于根据外部数据确定所述用户当前所处的场景信息,其中,所述外部数据包括:该用户的搜索数据、社交网页数据。
10.根据权利要求6至8中任意一项所述的装置,其特征在于,所述处理模块,还用于根据所述用户当前所处的场景信息和所述用户的场景转换历史确定所述用户的下一个场景信息。
【专利摘要】本发明提供了基于用户场景的数据处理方法和装置。该方法可包括:获取用户在预定时间段内的轨迹数据,轨迹数据包括一个以上三元组(用户,时间,位置),其中,三元组中各元素均具有一个或一个以上属性特征;根据三元组中各元素的一个或一个以上属性特征对轨迹数据聚类,并根据聚类结果中具有显著性的属性特征确定用户当前所处的场景信息;向用户发送与当前所处的场景信息关联的消息。实施上述方法和装置,与仅基于地理位置的场景刻画相比,改善了对用户场景的刻画精度,可区分处于同一地理位置上的不同场景。
【IPC分类】G06Q30-02, G06F17-30
【公开号】CN104657506
【申请号】CN201510112047
【发明人】赵继承
【申请人】百度在线网络技术(北京)有限公司
【公开日】2015年5月27日
【申请日】2015年3月13日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1