专利名称:一种基于流体模型的微博传播分析方法
技术领域:
本发明属于社会物理学领域,具体地说是一种基于流体模型的微博传播分析方法,其部分技术涉及到大规模网络图的布局算法,格子波尔兹曼(LBM)流体模型的演化算法,信息传播的机制以及计算机图形学等。
背景技术:
微博向人们提供了一个广阔的信息共享的平台,人们可以在这个平台上随时随地的交流探讨不同话题。其中,最具代表性的有TwitteiNFacebook、新浪微博,它们都吸引了大量的用户。作为一种新式社会网络,微博已成为近年来的研究热点与难点,包括文本数据的挖掘、社会网络的分析以及信息传播的研究。在信息传播的研究中,用户的行为与交互将极大程度上决定信息流动的趋势,但是这种用户行为与交互的分析异常复杂,因为在某一热点事件的微博传播过程中,往往有成千上万的用户参与,并且用户的行为与交互涉及到很多其他因素用户的心理,微博内容、公众对用户的信任、还有一些虚假信息的干扰、网络水军的影响等。相关研究人员已经提出了几种模型来模拟与分析人们的交流行为,解释探讨动态信息传播的过程。但是其中涉及到的机制过于复杂,太抽象化、公式化,往往不能被人们很好的理解。格子波尔兹曼(LBM)流体模型是目前流行于计算流体领域的物理模型,它的主要思想是用简单规则的微观粒子运动来反映宏观的流体变化,从微观粒子出发建立离散的速度模型,在满足质量、动量和能量守恒的条件下建立粒子分布函数的演化规则,然后对粒子分布函数进行统计,得到压力和流速等宏观变量。LBM方法还能够方便地处理复杂边界与障碍物的流体,也可以用来模拟多相流体。社会物理学已经进入现代社会物理学的发展阶段,旨在从社会微观行为的无序与随机中揭示出社会宏观行为的识别特征,从实证科学角度用物理学规律研究人类社会。之前很多关于社会物理学的著作已经论述了社会现象和物理模型之间的内在联系,进行深入挖掘并实现对社会行为规律的认知、模拟与调控。人们已将物理模型应用于诸多领域,例如社会网络、经济学、舆论动力学、交通地理学等。
发明內容本发明的目的在于克服微博传播模拟的现有方法中注重于数据挖掘、复杂模型公式的创立、结果展示不直观等问题,提供了一种基于LBM流体模型的微博传播分析方法,包括以下步骤I)基于微博数据的社会网络分析根据微博上的用户数据样本构建相应的社会网络并进行统计分析;根据社会网络的结构与微博传播的特点进行信息属性的提取。2)基于LBM流体模型的动态信息传播用LBM流体模型的基本演化公式模拟社会网络中网格内和网格间的信息交流过程;根据社会网络的性质,完善动态信息传播中的交互。3)流体形式的可视化用水波的扩散、涟漪、衍射等模拟微博信息的传播。LBM的基本框架初级的LBM将空间划分为规则的均匀网格,网格里都充满着一定数量的液体粒子。这样每个节点有8个邻居节点。粒子发生一次迁移时,只可能运动到这些邻居节点上,即粒子的运动方向有9种(包括粒子的静止状态)。对应于这9种运动状态,为该节点记录9个浮点值,记为fi, i = 0, ···,8,这里称之为分布密度(packet distribution functionvalue)。这些液体粒子在离散的时间步上沿着离散的方向运动到最近的网格中。公式(I)称为碰撞步,构造碰撞步的原则在于保证质量和动量的局部守恒。任一时刻在某节点r上,必定具有确定的速度和密度,各个运动方向上都对应一个确定的分布密度。假设在r上,总是存在一个平衡的状态,这个平衡状态依赖于该节点的速度和密度。而碰撞过程就是一个使各个分布密度向平衡状态变化的过程,对应于该平衡状态的分布密度标记为f q。于是在保证守恒条件的前提下,碰撞使得流体的动量重新分布,驱使流体向平衡状态运动fiir/) = f^rj)(Ji (r, t)) - /严(ρ, ))(1)fj (r+ei; t+l)=fi (r, t*) (2)其中,r表示一个格子节点,r+ei表示沿ei方向与r相邻的格子节点。公式(2)称为流动步,表示网格与邻居网格间的粒子交互。公式(I)中常量τ表示松弛因子,反应了
碰撞过程趋于平衡状态的快慢,这也就决定了流体的粘性V
权利要求
1. 一种基于流体模型的微博传播分析方法,其特征在于包括以下步骤a)基于微博数据的社会网络分析,具体包括i)根据微博上的用户数据样本构建社会网络图利用大规模网络图的快速分级布局算法构造该社会网络的布局;根据布局,进行统计分析为每个网格添加驱动力属性和障碍物属性;ii)信息属性的提取根据用户节点在社会网络中的重要性将节点划分为明星用户节点和普通用户节点;基于微博事件的传播特性,抽象出微博事件的两个特征即时效系数和内容关键系数;b)基于格子波尔兹曼流体模型的动态信息传播,具体包括i )基于格子波尔兹曼流体模型,将碰撞步与流动步映射为社会网络中网格内和网格间的信息交流过程;ii)根据社会网络的性质,完善动态信息传播中的交互根据网格的驱动力属性以及明星用户节点的影响来完善信息传播中的方向性、爆发c)流体形式的可视化,具体包括以社会网络的布局为背景,用绿色显示点的分布,不再显示线的分布;单一事件中根据信息量设置网格的颜色,信息量越大,颜色越红;针对两观点交锋事件,分别用红色、蓝色表示不同的观点的信息量分布。
全文摘要
本发明公开了一种基于流体模型的微博传播分析方法,其步骤为1)基于微博数据的社会网络分析根据微博的用户数据样本建立相应的社会网络布局并进行统计分析2)基于LBM流体模型的动态信息传播应用LBM流体模型来模拟微博传播的基本过程,并结合社会网络的性质,完善动态信息传播中的交互;3)用流体形式的可视化方法展示不同种类的事件、同一事件不同的观点的微博传播模拟,并加以分析探讨。应用本方法可以形象、生动的展示某一事件在微博网络中的传播情况,快速、逼真地对其信息传播进行预测分析,解决了现有模拟方法只注重于复杂模型公式的创立、结果展示不直观等问题,具有一定的实用价值。
文档编号G06F17/30GK102999617SQ201210500679
公开日2013年3月27日 申请日期2012年11月29日 优先权日2012年11月29日
发明者王长波, 刘玉华, 肖昭, 叶鹏 申请人:华东师范大学