1.一种基于因果推断的社交网络信息传播历史排序方法,其特征在于,包括:
收集社交网络中信息传播的历史记录,所述信息传播的历史记录与节点或边相关,社交网络中信息的传播是指信息从一个资源节点到一个目标节点的信息传播;
对信息传播的历史记录中的边按照其在信息传播的贡献度进行排序,所述排序是改进的因果效应差异算法,用以评估传播历史中边的重要性,进而衡量该边在此信息传播中的重要性。
2.根据权利要求1所述的方法,其特征在于,所述收集社交网络中信息传播的历史记录表征为:
社交网络中的信息散播事件为ε,信息源为S,目标节点为ti表示一个传播轨迹,它由li个连续的边
组成;
Φ为一个散播过程的传播历史记录,Τ为Φ中边的集合。
3.根据权利要求2所述的方法,其特征在于,所述信息传播的历史记录中,某条特定的边X对于信息传播成功的贡献度有以下两种衡量方式:
边X失效,信息传输成功的概率为:P(Φx'=true);
边X有效,信息传输成功的概率为:P(Φx=true);
其中,x和x’分别代表边X在在随机实验中“有效”和“失效”的情况,P(Φx'=true)和P(Φx=true)是两个因果变量,分别表示边X在信息传播过程中的必要部分和充分部分。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述因果效应差异算法是将P(Φx'=true)和P(Φx=true)两个因果变量结合,即同时考虑因果关系的充分部分和必要部分,其算法公式为:
DCE(X)=P(Φx=true)-P(Φx'=true)。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述因果效应差异算法包括信息传播过程中的必要部分和充分部分,所述信息传播过程中的必要部分称之为责任,所述信息传播过程中的充分部分称之为能力;
信息传播中的因果关系为:
令T为信息传播历史中的边的集合,t为信息传播历史中的一个参与边,t∈T,Γ为信息传播历史中一部分边的集合,如果满足:
从T中移除Γ之后,从信息源到目标节点
的信息传播仍然成功;
从T中移除Γ之后,进一步移除t会导致信息传播的失效;
则称t为信息散播的原因,Γ为t的预想故障集;
t在信息传播中的责任为:
Γ包含了所有t的预想故障集;
t在信息传播中的能力为:
其中τ表示所有经过t的传播路径,函数st(τ)的返回值为τ的边集;
所述运用因果效应差异算法对信息传播的历史记录中的边按照其在信息传播中的贡献度进行排序的策略,称之为“责任-能力”的排序策略。
6.根据权利要求5所述的方法,其特征在于,所述“责任-能力”的排序策略的算法公式为:
score=α*fn(responsibility)+(1-α)fn(capability)
其中fn表示计算标准分的一个正则化函数,responsibility代表责任,capability代表能力,0<α<1是一个平衡因子。
7.根据权利要求5所述的方法,其特征在于,所述责任的算法实现包括:
输入传播历史记录Φ,Φ中边的集合T,以及一条边t∈T;
得到覆盖集合SA=sc(t,Φ),以及未覆盖集合ST=Φ-SA,所述sc(tj,Φ)={ci|tj∈ci∧ci∈Φ};初始预想事故集
选择边x∈T-Γ;
将x添加到Γ中,从SA中移除sc(x,SA),从ST中移除sc(x,ST);
重复上述两个步骤,直至ST为空;
输出作为t的责任值。
8.根据权利要求7所述的方法,其特征在于,所述选择边x∈T-Γ满足以下两个条件:
sc(x,ST)尽可能多的覆盖ST中的集合;
SA≠sc(x,SA)。