基于多媒体数字影像评论的数据挖掘与处理方法及系统与流程

文档序号:12786467阅读:198来源:国知局
基于多媒体数字影像评论的数据挖掘与处理方法及系统与流程
本发明涉及数据挖掘
技术领域
,特别涉及一种基于多媒体数字影像评论的数据挖掘与处理方法及系统。
背景技术
:随着多媒体技术的发展,人们接触的数据形式不断地丰富,多媒体数据库的日益增多,原有的数据库技术已经满足不了应用的需求,人们希望从这些媒体数据中得到一些高层的概念和模式,找出蕴含于其中的有价值的知识。这种将数字挖掘技术与多媒体信息处理技术有机结合起来形成的在多媒体数据中进行知识发现的信息处理方法就是多媒体数据挖掘。但是从现有的多媒体技术中找出有价值的知识既费时又繁琐。鉴于以上现有技术存在的问题,本发明希望找到一种基于多媒体数字影像评论的数据挖掘与处理方法及系统。技术实现要素:发明目的:对上述情况,为了克服
背景技术
中的缺点,本发明实施例提供了一种基于多媒体数字影像评论的数据挖掘与处理方法及系统,能够有效解决上述
背景技术
中涉及的问题。技术方案:一种基于多媒体数字影像评论的数据挖掘与处理方法,所述方法包括:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;建立所述影评数据与所述用户页面数据之间的映射关系;对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。作为本发明的一种优选方式,兴趣属性分析并依次得出兴趣属性点,包括:按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。作为本发明的一种优选方式,兴趣属性分析并依次得出兴趣属性点,包括:按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。作为本发明的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:从社交网络上挖掘与影片相关的非影评数据,分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。作为本发明的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:从影片购票网站上获取基于影片的检索和/或购票操作事件,获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。一种基于多媒体数字影像评论的数据挖掘与处理系统,所述系统包括:第一数据挖掘模块,用于利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;映射建立模块,用于建立所述影评数据与所述用户页面数据之间的映射关系;兴趣属性分析模块,用于对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点;分类聚合模块,用于将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;数据集获取模块,用于获取分类聚合后的与各用户页面数据集相互映射的影评数据集;事件侦测模块,用于侦测待观影操作事件;第二数据挖掘模块,用于挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点;数据集查找模块,用于查找与其兴趣属性点相符量超出第二预设量的用户页面数据集;数据集推送模块,用于将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。作为本发明的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。作为本发明的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。作为本发明的一种优选方式,所述事件侦测模块进一步用于从社交网络上挖掘与影片相关的非影评数据;所述第二数据挖掘模块进一步用于分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。作为本发明的一种优选方式,所述事件侦测模块进一步用于从影片购票网站上获取基于影片的检索和/或购票操作事件;所述第二数据挖掘模块进一步用于获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。本发明实现以下有益效果:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘;建立影评数据与所述用户页面数据之间的映射关系;对用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集。使用户找到对自己有价值的数据更加方便快捷,避免了繁琐的数据搜集。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并于说明书一起用于解释本公开的原理。图1为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流映射关系图;图2为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流程示意图;图3为本发明提供一种基于多媒体数字影像评论的数据挖掘与处理系统构架示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。实施例一请参考图1,图2,图1为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法映射关系图;图2为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流程示意图;具体的,本实施例提供一种基于多媒体数字影像评论的数据挖掘与处理方法,所述方法包括以下步骤:Step101:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘;Step102:建立所述影评数据与所述用户页面数据之间的映射关系;Step103:对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;Step104:侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集。具体的,在实际的实施过程中,利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘。例如,在本实施例中对如下几部电影的影评数据进行挖掘:将上述表格所述的影评数据与用户页面数据建立映射关系。对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;在本实施例中,兴趣点相符的预设量为三个以上,如上述表格所述,张华与李江、王梅与赵四、孙红与吴名兴趣点相符的预设量为三个以上,则将兴趣属性点相符的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集。另外,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。作为本发明的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:从社交网络上挖掘与影片相关的非影评数据,分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。作为本发明的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:从影片购票网站上获取基于影片的检索和/或购票操作事件,获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。在本实施例中,社交网络可以包括微博、微信等;例如,某用户在微博上转发了杨洋主演的电影从你的全世界路过并附上了期待上映等关键词,侦测待观影操作事件挖掘出用户在微博上的用户页面数据。另外一种获取用户页面数据的方式,例如,某用户在美团上搜索了这部电影或者正在购买电影票,侦测待观影操作事件并获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。假设侦测到针对电影《28岁未成年》的待观影操作事件,则挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。实施例二请参考图1,图2,图1为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法映射关系图;图2为本发明提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流程示意图;实施例二所提供基于多媒体数字影像评论的数据挖掘与处理方法,与实施例一中所述大体类似,不同之处在于:兴趣属性分析并依次得出兴趣属性点,包括:按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。兴趣属性分析并依次得出兴趣属性点,包括:按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。例如,在本实施例中对以下的数据进行分析:关键词评价意向电影:复仇者联盟好莱坞的影片不是浪得虚名。食物:糖酷排骨偏南方口味,很可口。旅游地:杭州西湖旅游旺季,人太多,不想再体会了。游乐场:上海迪士尼下次有机会再去一次。如上述表格所述,在四个关键词中,该用户对旅游地的评价意向表示不想,对电影、食物、游乐场的评价意向表现出了喜爱,则将评价意向为喜爱的关键词列为兴趣属性点。另外一种兴趣属性分析并依次得出兴趣属性点的方法,例如,在本实施例中,某用户使用的社交网络是微博,对该用户微博关注的人群进行了一下划分:行业下位代名词经济金融凤凰传奇企业管理SHE法律法规BigBang社会民生SNH48如上述表格所述,该用户对乐队团体比较感兴趣,则将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。实施例三请参考图3,图3为本发明提供一种基于多媒体数字影像评论的数据挖掘与处理系统构架示意图。具体的,本实施例提供一种基于多媒体数字影像评论的数据挖掘与处理系统,包括:第一数据挖掘模块,用于利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;映射建立模块,用于建立所述影评数据与所述用户页面数据之间的映射关系;兴趣属性分析模块,用于对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点;分类聚合模块,用于将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;数据集获取模块,用于获取分类聚合后的与各用户页面数据集相互映射的影评数据集;事件侦测模块,用于侦测待观影操作事件;第二数据挖掘模块,用于挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点;数据集查找模块,用于查找与其兴趣属性点相符量超出第二预设量的用户页面数据集;数据集推送模块,用于将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。作为本发明的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。作为本发明的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。作为本发明的一种优选方式,所述事件侦测模块进一步用于从社交网络上挖掘与影片相关的非影评数据;所述第二数据挖掘模块进一步用于分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。作为本发明的一种优选方式,所述事件侦测模块进一步用于从影片购票网站上获取基于影片的检索和/或购票操作事件;所述第二数据挖掘模块进一步用于获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。应理解实施例三具体实现的过程可与实施例一、实施例二的描述相对应,此处不再详细描述。上述实施例只为说明本发明的技术构思及特点,其目的是让熟悉该
技术领域
的技术人员能够了解本发明的内容并据以实施,并不能以此来限制本发明的保护范围。凡根据本发明精神实质所作出的等同变换或修饰,都应涵盖在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1