一种消息类别确定方法、装置及存储介质

文档序号:30232990发布日期:2022-06-01 06:34阅读:57来源:国知局
一种消息类别确定方法、装置及存储介质

1.本说明书实施例涉及人工智能技术领域,特别涉及一种消息类别确定方法、装置及存储介质。


背景技术:

[0002][0003]
注意力机制(attention mechanism)源于对人类视觉的研究。在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息。上述机制通常被称为注意力机制。近年来,注意力机制被广泛应用到基于深度学习的自然语言处理各个任务中,得益于注意力机制,现有的工作能更好的捕捉判别谣言相关的消息和用户,并提供一定程度的可解释性。
[0004]
在上述识别消息是否是谣言的方式中,定位影响谣言判别的消息、词汇能一定程度上捕获到不同真实性谣言的数据偏差,但由于新闻事件的重复率较低,此类方法无法对未在训练语料中出现的消息、词汇进行感知,泛化能力较差;定位对谣言传播具有关键影响的用户能一定程度上捕捉恶意用户(malicious users)的特征,但此类方法忽略了谣言传播时显式的文本含义。
[0005]
因此,对于消息是否是谣言的识别方式,现有技术仍然存在准确度低的问题。


技术实现要素:

[0006]
本说明书实施例的目的是提供一种消息类别确定方法、装置及存储介质,以提高消息类别确定的准确性。
[0007]
为解决上述问题,本说明书实施例提供一种消息类别确定方法,所述方法包括:获取多个带有标注的信息传播树;其中,每个信息传播树包括源消息和多个与所述源消息相关的转发消息;所述转发消息标注有所述转发消息的第一类别;对转发信息的传播方向和交互特征进行建模,以提取各个转发消息的第一特征;根据第一损失函数对各个转发消息的第一特征和各个转发消息对应的第一类别进行拟合,得到转发消息的第一归类条件;根据所述第一归类条件确定待归类信息传播树中各个转发消息的第一类别。
[0008]
进一步地,所述源消息标注有所述源消息的第二类别,所述方法还包括:根据预设规则对不同类别的转发消息赋予不同的权重;根据转发消息的权重对所述信息传播树中各个转发消息进行加权求和,得到各个信息传播树中源消息的第二特征;根据第二损失函数对各个信息传播树中源消息的第二特征和各个源消息的第二类别进行拟合,得到源消息的第二归类条件;根据所述第二归类条件和所述待归类信息传播树中各个转发消息的第一类别确定待归类信息传播树中源消息的第二类别。
[0009]
进一步地,所述根据预设规则对不同类别的转发消息赋予不同的权重包括:
[0010][0011]ai
表示第i个节点对应的转发消息的权重,表示第个节点的对应的转发消息的
第一类别。
[0012]
进一步地,所述对转发信息的传播方向和交互特征进行建模,以提取各个转发消息的第一特征包括:将各个信息传播树构建为由节点和边组成的无向图结构;其中,节点表示转发消息,边表示转发消息的传播关系;根据转发信息的传播方向和交互特征将所述无向图结构拆分为第一有向图结构和第二有向图结构;所述第一有向图结构表征从父节点传向子节点的信息流动,所述第二有向图结构表征子节点传向父节点的信息流动;使用图循环神经网络分别对所述第一有向图结构和所述第二有向图结构中相邻的节点进行特征融合,以提取各个转发消息的第一特征。
[0013]
进一步地,所述使用图循环神经网络分别对所述第一有向图结构和所述二有向图结构中相邻的节点进行特征融合,以提取各个转发消息的第一特征包括:分别对所述第一有向图结构和所述二有向图结构中的每个叶子节点加上自环;对加上自环后的所述第一有向图结构和所述二有向图结构进行归一化操作;使用图循环神经网络分别对归一化后的所述第一有向图结构和归一化后的所述二有向图结构中相邻的节点进行特征融合,以提取各个转发消息的第一特征。
[0014]
进一步地,所述对加上自环后的所述第一有向图结构和所述第二有向图结构进行归一化操作包括:
[0015][0016][0017]
其中,表示a
p
,ac对角元素等于节点度数的对角矩阵,a
p
,ac分别表示第一有向图结构的邻接矩阵和第二有向图结构的邻接矩阵,表示归一化的邻接矩阵。
[0018]
为解决上述问题,本说明书实施例还提供一种消息类别确定装置,所述装置包括:获取模块,用于获取多个带有标注的信息传播树;其中,每个信息传播树包括源消息和多个与所述源消息相关的转发消息;所述转发消息标注有所述转发消息的第一类别;提取模块,用于对转发信息的传播方向和交互特征进行建模,以提取各个转发消息的第一特征;第一拟合模块,用于根据第一损失函数对各个转发消息的第一特征和各个转发消息对应的第一类别进行拟合,得到转发消息的第一归类条件;第一确定模块,用于根据所述第一归类条件确定待归类信息传播树中各个转发消息的第一类别。
[0019]
进一步地,所述源消息标注有所述源消息的第二类别,所述装置还包括:赋权模块,用于根据预设规则对不同类别的转发消息赋予不同的权重;求和模块,用于根据转发消息的权重对所述信息传播树中各个转发消息进行加权求和,得到各个信息传播树中源消息的第二特征;第二拟合模块,用于根据第二损失函数对各个信息传播树中源消息的第二特征和各个源消息的第二类别进行拟合,得到源消息的第二归类条件;第二确定模块,用于根据所述第二归类条件和所述待归类信息传播树中各个转发消息的第一类别确定待归类信息传播树中源消息的第二类别。
[0020]
为解决上述问题,本说明书实施例还提供一种电子设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序以实现:获取多个带有标注的信息传播树;其中,每个信息传播树包括源消息和多个与所述源消息相关的转发消息;所述转发消息标
注有所述转发消息的第一类别;对转发信息的传播方向和交互特征进行建模,以提取各个转发消息的第一特征;根据第一损失函数对各个转发消息的第一特征和各个转发消息对应的第一类别进行拟合,得到转发消息的第一归类条件;根据所述第一归类条件确定待归类信息传播树中各个转发消息的第一类别。
[0021]
为解决上述问题,本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现:获取多个带有标注的信息传播树;其中,每个信息传播树包括源消息和多个与所述源消息相关的转发消息;所述转发消息标注有所述转发消息的第一类别;对转发信息的传播方向和交互特征进行建模,以提取各个转发消息的第一特征;根据第一损失函数对各个转发消息的第一特征和各个转发消息对应的第一类别进行拟合,得到转发消息的第一归类条件;根据所述第一归类条件确定待归类信息传播树中各个转发消息的第一类别。
[0022]
由以上本说明书实施例提供的技术方案可见,本说明书实施例中,可以获取多个带有标注的信息传播树;其中,每个信息传播树包括源消息和多个与所述源消息相关的转发消息;所述转发消息标注有所述转发消息的第一类别;对转发信息的传播方向和交互特征进行建模,以提取各个转发消息的第一特征;根据第一损失函数对各个转发消息的第一特征和各个转发消息对应的第一类别进行拟合,得到转发消息的第一归类条件;根据所述第一归类条件确定待归类信息传播树中各个转发消息的第一类别。本说明书实施例提供的方法,通过对信息传播树中转发消息的传播方向、交互特征进行建模,并用于转发消息的类别识别,提高了转发消息类别识别的准确性;进一步的,通过提取信息传播树中各个转发消息的特征来识别信息传播树中源消息的类别,构造了前置性的更细粒度的消息级别上的任务,从而提高了源消息类别识别的准确性。
附图说明
[0023]
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024]
图1为本说明书实施例一种消息类别确定方法的流程图;
[0025]
图2为本说明书实施例另一种消息类别确定方法的流程图;
[0026]
图3为本说明书实施例一种电子设备的功能结构示意图;
[0027]
图4为本说明书实施例一种消息类别确定装置的功能结构示意图。
具体实施方式
[0028]
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
[0029]
早期谣言检测的模型主要基于特征工程,研究者们从传播内容、用户可信度、传播影响力等方面提取特征。近年来深度学习提供了更易实施的解决方案,避免了特征工程中
繁琐的特征提取过程和主观认知偏差。将信息传播树组织成不同形式(时间序列、树状结构或图结构),从而使用现有的深度学习模型进行建模获取传播树全局表示。研究者们还利用立场 (stance)信息辅助谣言判别,使用多任务学习框架,提高了数据的利用率并一定程度抑制过拟合现象。还有研究者基于层次注意力(hierarchical attention)机制、互注意力(co-attention) 机制捕捉对谣言判别有辅助作用的句子、词汇、用户。
[0030]
然而,在上述识别消息是否是谣言的方式中,定位影响谣言判别的消息、词汇能一定程度上捕获到不同真实性谣言的数据偏差,但由于新闻事件的重复率较低,此类方法无法对未在训练语料中出现的消息、词汇进行感知,泛化能力较差;定位对谣言传播具有关键影响的用户能一定程度上捕捉恶意用户(malicious users)的特征,但此类方法忽略了谣言传播时显式的文本含义。
[0031]
经过申请人从量化的角度探索了谣言的传播机制,发现对谣言治理工作具有启示意义的有三点:(1)谣言之所以比普通消息传播的更快、更广,可能的原因是谣言带来了更多的新颖信息(information novelty);(2)谣言传播过程中回声室效应(echo chamber member effect) 明显,即小部分用户所形成的扭曲偏执的意见容易在社交网络上被传播和讨论,并被大部分不明真相的用户视作为真相,从而形成病毒式的谣言传播;(3)谣言传播中广泛存在着三类角色:信论(seeds)坚定相信消息的真实性、疑论(agnostics)质疑消息的真实性、其他(others) 持有其他无关意见的消息。考虑到如果能对谣言判别任务构造前置性的更细粒度的消息级别上的任务,更细粒度的消息的传播方向、交互特征进行建模,则有望解决现有技术中谣言的判别不准确的问题。基于此,本说明书实施例提供一种消息类别确定方法、装置及存储介质,以提高消息类别确定的准确性。
[0032]
请参阅图1。本说明书实施例提供一种消息类别确定方法。在本说明书实施例中,执行所述消息类别确定方法的主体可以是具有逻辑运算功能的电子设备,所述电子设备可以是服务器。所述服务器可以是具有一定运算处理能力的电子设备。其可以具有网络通信单元、处理器和存储器等。当然,所述服务器并不限于上述具有一定实体的电子设备,其还可以为运行于上述电子设备中的软体。所述服务器还可以为分布式服务器,可以是具有多个处理器、存储器、网络通信模块等协同运作的系统。或者,服务器还可以为若干服务器形成的服务器集群。所述方法可以包括以下步骤。
[0033]
s110:获取多个带有标注的信息传播树;其中,每个信息传播树包括源消息和多个与所述源消息相关的转发消息;所述转发消息标注有所述转发消息的第一类别。
[0034]
在本说明书实施例中,信息的传播通常是以树的形式进行传播,源消息可以是信息传播树的起始点,转发消息为树的分支,转发消息可以是针对源消息的评论,针对其他转发消息的评论等。每个信息传播树可以包括源消息和多个与所述源消息相关的转发消息。举例来说,源消息可以是一篇文章、一条微博、一条推特等等,转发消息可以是针对这些文章、微博、推特等的评论,或者是评论的评论等。
[0035]
谣言判别是在传播树级别上进行的分类任务,即给定一条未经证实的源消息r0及相应的转发消息{r1,r2,
…rt
},预测传播的树的真实性,将源消息分类(第二类别)为真实的(true)、虚假的(false)和未能证实的(unverified)。信息引爆点识别是在消息级别进行的分类任务,即对传播树中涉及的每一则转发消息,将其分类(第一类别)为开启话题(amplify)、反对质疑(deny)、澄清说明(clarify)、无意义的(null)。其中,信息引爆点代表
的是对谣言传播具有推动作用或对谣言判别具有指示意义的转发消息。
[0036]
在本说明书实施例中,带有标注的信息传播树可以为对源消息和/或对转发消息进行了标注的信息传播树。具体的,对于各个信息传播树中的转发消息,可以预先由人工进行标注,注明转发消息的第一类别,即注明转发消息属于开启话题类别、反对质疑类别、澄清说明类别还是无意义的类别;同样的,对于各个信息传播树中的源消息,也可以预先由人工进行标注,注明源消息的第二类别,即注明源消息属于真实的类别、虚假的类别和未能证实的类别。
[0037]
在本说明书实施例中,可以获取多个带有标注的信息传播树,在每个信息传播树中,各个转发消息都标注有该转发消息的类别。
[0038]
s120:对转发信息的传播方向和交互特征进行建模,以提取各个转发消息的第一特征。
[0039]
内容连贯性可以通过和上文和下文的文本相似度来呈现的,和上文的相似度由该条消息和父节点之间相同词汇数量与最长文本词汇数量的比值来确定;和下文的相似度通过计算出和每条子节点文本的相似度后取平均来确定。
[0040]
对4类转发消息分别计算不同事件中两类相似度的平均值,发现:(1)从整体上来看,对于不同事件的数据,各种类别的转发信息在文本相似度呈现出较高的一致性,说明了信息引爆点在不同事件背景下也具有类似的文本交互特征。(2)对于不同类别的转发信息,开启话题类别的转发消息和父节点相似度较低、而和子节点的相似度极高,说明子节点大多基于新话题开始讨论;反对质疑类别的转发消息和父节点以及子节点的相似度都较低,大多包含否定态度类的情感词汇;澄清说明类别的转发消息和父节点、子节点的相似度处于中等水平,会更多的基于上文文本进行阐述。
[0041]
通过对转发信息的传播方向和交互特征进行建模,可以以提取各个转发消息的第一特征。其中,所述第一特征可以是特征向量,通过向量的形式提取转发消息的第一特征。
[0042]
近年来,图神经网络受到了越来越多的关注,信息传播树也可通过图神经网络进行建模,其中节点代表每条消息,边代表消息之间的转发关系。但目前的图神经网络多用于对同质 (homogeneous)节点图的建模中,此类图中相连节点的属性较为相似,因此通过消息传递 (message passing)机制,能极大丰富节点特征。而信息传播树中,通过转发关系相连的节点往往有异质(heterogeneous)倾向,现有的图神经网络对社交网络文本传播的建模能力不足。此外,谣言判别是对这个图进行分类,而目前对全图进行表示学习的方法常采用平均池化(mean pooling)、注意力池化(attention pooling),表示过程较为粗糙。
[0043]
基于此,在一些实施例中,可以在现有图神经网络的基础上,考虑消息的传播方向和交互特征进行节点特征的更新,并利用引爆点信息对全图进行表示。具体的,所述对转发信息的传播方向和交互特征进行建模,以提取各个转发消息的第一特征包括:
[0044]
将各个信息传播树构建为由节点和边组成的无向图结构;其中,节点表示转发消息,边表示转发消息的传播关系;根据转发信息的传播方向和交互特征将所述无向图结构拆分为第一有向图结构和第二有向图结构;所述第一有向图结构表征从父节点传向子节点的信息流动,所述第二有向图结构表征子节点传向父节点的信息流动;使用图循环神经网络分别对所述第一有向图结构和所述第二有向图结构中相邻的节点进行特征融合,以提取各个转发消息的第一特征。
[0045]
具体的,每一则信息传播树可以被构建为由节点和边组成的图(graph)其中表示节点集合,一个节点代表着一条消息,ε表示边的集合,边由转发消息之间的转发关系产生。每个节点的初始化表示由预训练语言模型bert获得,取句中[cls]标志的表示作为句子表示。在模型整体训练中,固定初始化的句子表示,以加快训练速度。将所有句子表示堆叠在一起,可得到图的节点特征矩阵
[0046]
通常,无向图结构中的边由对称的邻接矩阵进行表示,如果节点i和节点j 之间有连边,则a
ij
=a
ji
=1。然而,将这样传统的图结构表示应用到传播图建模中忽略了信息流动方向和信息交互的建模。因此,在本说明书实施例中,可以将无向图结构的邻接矩阵进行拆分,形成两个有向图结构表示a
p
,ac,分别表示从父节点传向子节点的信息流动以及从子节点传向父节点的信息流动。
[0047]
在一些实施例中,所述使用图循环神经网络分别对所述第一有向图结构和所述二有向图结构中相邻的节点进行特征融合,以提取各个转发消息的第一特征包括:
[0048]
分别对所述第一有向图结构和所述二有向图结构中的每个叶子节点加上自环;对加上自环后的所述第一有向图结构和所述二有向图结构进行归一化操作;使用图循环神经网络分别对归一化后的所述第一有向图结构和归一化后的所述二有向图结构中相邻的节点进行特征融合,以提取各个转发消息的第一特征。
[0049]
具体的,所述对加上自环后的所述第一有向图结构和所述第二有向图结构进行归一化操作包括:
[0050][0051][0052]
其中,表示a
p
,ac对角元素等于节点度数的对角矩阵,表示节点集合, a
p
,ac分别表示第一有向图结构的邻接矩阵和第二有向图结构的邻接矩阵,表示归一化的邻接矩阵。
[0053]
图循环神经网络将循环神经单元作为消息传递的方式,同时结合了图卷积神经网络高效的特征融合的方式,可以扩展成l层的结构。在进行第l层节点表示更新时,需要用到上一层即第l-1层的节点表示。具体地,以从父节点传向子节点的方向为例,先是用邻接矩阵对节点的相连节点进行特征融合,如公式(3)所示,得到临时的聚合表示接着以上一层节点表示为输入、以临时的聚合表示为初始化隐状态,以长短时记忆单元 (long-short-term memory unit)的计算方式进行消息传递,得到第l层的节点表示。在本说明书实施例中,以采用了一层的图循环神经网络为例。
[0054][0055]
s130:根据第一损失函数对各个转发消息的第一特征和各个转发消息对应的第一类别进行拟合,得到转发消息的第一归类条件。
[0056]
所述第一损失函数可以表征拟合得到的转发消息的第一类别(预测值)和标注的
转发消息的第一类别(标注值)之间的误差。所述损失函数(loss function)是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。在应用中,损失函数通常作为学习准则与优化问题相联系,即通过最小化损失函数求解和评估模型。
[0057]
在一些实施例中,可以通过前馈神经网络(feed forward network,ffn),对转发消息所属的第一类别进行识别,并利用交叉熵(corss-entropy)损失函数进行拟合:
[0058][0059][0060]
其中,表示拟合(预测)的转发消息的第一类别,表示采用了一层的图循环神经网络得到的特征(转发消息的第一特征),表示第一损失函数,表示拟合值,表示标注值,l
t
表示拟合的数量。
[0061]
在一些实施例中,所述第一归类条件可以为各个转发消息的第一特征和各个转发消息对应的第一类别的映射关系,例如可以为f(x1)=y
′1。其中,x1表示转发消息的第一特征,y
′1表示拟合(预测)的转发消息的第一类别。
[0062]
s140:根据所述第一归类条件确定待归类信息传播树中各个转发消息的第一类别。
[0063]
在得到转发消息的第一归类条件后,可以跟根据所述第一归类条件确定待归类信息传播树中各个转发消息的第一类别。具体的,可以获取待归类信息传播树,根据s120的方式提取待归类信息传播树中各个转发消息的第一特征,将这些第一特征作为输入,根据所述第一归类条件得到各个转发消息的第一类别。
[0064]
上述待归类信息传播树中各个转发消息的第一类别的确定方式,通过对信息传播树中转发消息的传播方向、交互特征进行建模,并用于转发消息的类别识别,提高了转发消息类别识别的准确性。
[0065]
在一些实施例中,为进一步对源消息的第二类别进行识别,如图2所示,所述方法还包括以下步骤。
[0066]
s210:根据预设规则对不同类别的转发消息赋予不同的权重。
[0067]
通过研究调查发现反对质疑的转发消息在虚假类别的源消息中的比例远高于其他两类源消息;澄清说明在虚假类别的源消息中比例也较高,并且在前期较长时间段内都频繁出现,因而鉴别不同类别的转发消息也会对最终的源消息判别有辅助作用。
[0068]
在一些实施例中,根据预设规则对不同类别的转发消息赋予不同的权重,使得标注为无意义(null)的转发消息对源消息的判别的权重影响尽可能的小,以此结果作为权重。具体的,所述根据预设规则对不同类别的转发消息赋予不同的权重包括:
[0069][0070]ai
表示第i个节点对应的转发消息的权重,表示第i个节点的对应的转发消息的第一类别。
[0071]
s220:根据转发消息的权重对所述信息传播树中各个转发消息进行加权求和,得到各个信息传播树中源消息的第二特征。
[0072]
具体的,对所述信息传播树中各个转发消息进行加权求和包括:
[0073][0074]
其中,c为表征源消息的第二特征的矩阵。
[0075]
s230:根据第二损失函数对各个信息传播树中源消息的第二特征和各个源消息的第二类别进行拟合,得到源消息的第二归类条件。
[0076]
在一些实施例中,可以通过前馈神经网络(feed forward network),对源消息所属的第二类别进行识别,并利用交叉熵(corss-entropy)损失函数进行拟合:
[0077][0078][0079]
其中,yv表示拟合(预测)的源消息的第二类别,表示第二损失函数,y
v,j
表示拟合值,表示标注值,lv表示拟合的数量。
[0080]
在一些实施例中,所述第二归类条件可以为各个源消息的第二特征和各个源消息对应的第二类别的映射关系,例如可以为f(x2)=y
′2。其中,x2表示源消息的第二特征,y
′2表示拟合(预测)的源消息的第二类别。
[0081]
s240:根据所述第二归类条件和所述待归类信息传播树中各个转发消息的第一类别确定待归类信息传播树中源消息的第二类别。
[0082]
在得到源消息的第二归类条件后,可以跟根据所述第二归类条件确定待归类信息传播树中源消息的第二类别。具体的,可以获取待归类信息传播树,根据s120的方式提取待归类信息传播树中各个转发消息的第一特征,将这些第一特征作为输入,根据所述第一归类条件得到各个转发消息的第一类别,然后根据s210和s220对待归类信息传播树中各个转发消息进行加权求和,得到待归类信息传播树中源消息的第二特征,将第二特征作为输入,根据所述第二归类条件得到源消息的第二类别。
[0083]
本说明书实施例提供的方法,通过对信息传播树中转发消息的传播方向、交互特征进行建模,并用于转发消息的类别识别,提高了转发消息类别识别的准确性;进一步的,通过提取信息传播树中各个转发消息的特征来识别信息传播树中源消息的类别,构造了前置性的更细粒度的消息级别上的任务,从而提高了源消息类别识别的准确性。
[0084]
本说明书上述实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的电子设备中执行。图3为本说明书实施例一种电子设备的功能结构示意图,所述电子设备可以包括存储器和处理器。
[0085]
在一些实施例中,所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现共享设备位置预测方法的各种功能。所述存储器可主要包括存储程序区和存
储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据用户终端的使用所创建的数据。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0086]
所述处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specificintegrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。所述处理器可以执行所述计算机指令实现以下步骤:获取多个带有标注的信息传播树;其中,每个信息传播树包括源消息和多个与所述源消息相关的转发消息;所述转发消息标注有所述转发消息的第一类别;对转发信息的传播方向和交互特征进行建模,以提取各个转发消息的第一特征;根据第一损失函数对各个转发消息的第一特征和各个转发消息对应的第一类别进行拟合,得到转发消息的第一归类条件;根据所述第一归类条件确定待归类信息传播树中各个转发消息的第一类别。
[0087]
在一些实施例中,所述所述处理器还可以执行所述计算机指令实现以下步骤:根据预设规则对不同类别的转发消息赋予不同的权重;根据转发消息的权重对所述信息传播树中各个转发消息进行加权求和,得到各个信息传播树中源消息的第二特征;根据第二损失函数对各个信息传播树中源消息的第二特征和各个源消息的第二类别进行拟合,得到源消息的第二归类条件;根据所述第二归类条件和所述待归类信息传播树中各个转发消息的第一类别确定待归类信息传播树中源消息的第二类别。
[0088]
在本说明书实施例中,该电子设备具体实现的功能和效果,可以与其它实施例对照解释,在此不再赘述。
[0089]
图4为本说明书实施例一种消息类别确定装置的功能结构示意图,该装置具体可以包括以下的结构模块。
[0090]
获取模块410,用于获取多个带有标注的信息传播树;其中,每个信息传播树包括源消息和多个与所述源消息相关的转发消息;所述转发消息标注有所述转发消息的第一类别;
[0091]
提取模块420,用于对转发信息的传播方向和交互特征进行建模,以提取各个转发消息的第一特征;
[0092]
第一拟合模块430,用于根据第一损失函数对各个转发消息的第一特征和各个转发消息对应的第一类别进行拟合,得到转发消息的第一归类条件;
[0093]
第一确定模块440,用于根据所述第一归类条件确定待归类信息传播树中各个转发消息的第一类别。
[0094]
在一些实施中,所述装置还可以包括:
[0095]
赋权模块,用于根据预设规则对不同类别的转发消息赋予不同的权重;
[0096]
求和模块,用于根据转发消息的权重对所述信息传播树中各个转发消息进行加权求和,得到各个信息传播树中源消息的第二特征;
[0097]
第二拟合模块,用于根据第二损失函数对各个信息传播树中源消息的第二特征和各个源消息的第二类别进行拟合,得到源消息的第二归类条件;
[0098]
第二确定模块,用于根据所述第二归类条件和所述待归类信息传播树中各个转发消息的第一类别确定待归类信息传播树中源消息的第二类别。
[0099]
本说明书实施例还提供了一种消息类别确定方法的计算机可读存储介质,所述计算机可读存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取多个带有标注的信息传播树;其中,每个信息传播树包括源消息和多个与所述源消息相关的转发消息;所述转发消息标注有所述转发消息的第一类别;对转发信息的传播方向和交互特征进行建模,以提取各个转发消息的第一特征;根据第一损失函数对各个转发消息的第一特征和各个转发消息对应的第一类别进行拟合,得到转发消息的第一归类条件;根据所述第一归类条件确定待归类信息传播树中各个转发消息的第一类别。
[0100]
在一些实施例中,在所述计算机程序指令被执行时还实现:根据预设规则对不同类别的转发消息赋予不同的权重;根据转发消息的权重对所述信息传播树中各个转发消息进行加权求和,得到各个信息传播树中源消息的第二特征;根据第二损失函数对各个信息传播树中源消息的第二特征和各个源消息的第二类别进行拟合,得到源消息的第二归类条件;根据所述第二归类条件和所述待归类信息传播树中各个转发消息的第一类别确定待归类信息传播树中源消息的第二类别。
[0101]
在本说明书实施例中,上述存储介质包括但不限于随机存取存储器(random accessmemory,ram)、只读存储器(read-only memory,rom)、缓存(cache)、硬盘(hard diskdrive,hdd)或者存储卡(memory card)。所述存储器可用于存储所述计算机程序和/或模块,所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据用户终端的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器。在本说明书实施例中,该计算机可读存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
[0102]
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其它实施例的不同之处。尤其,对于装置实施例和设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0103]
本领域技术人员在阅读本说明书文件之后,可以无需创造性劳动想到将本说明书列举的部分或全部实施例进行任意组合,这些组合也在本说明书公开和保护的范围内。
[0104]
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0105]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例
的部分说明即可。
[0106]
本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
[0107]
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0108]
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1