人物网络活跃度计算方法、系统、处理终端、计算机设备与流程

文档序号:24873203发布日期:2021-04-30 12:46阅读:163来源:国知局
人物网络活跃度计算方法、系统、处理终端、计算机设备与流程

本发明公开涉及网络空间认知技术领域,尤其涉及一种基于开源数据的人物网络活跃度计算方法及系统。



背景技术:

依据不同的情景,活跃度具有不同的含义。在证券行业,活跃度一般用于评价某只股票的交易频率的高低。在社交网络中,用户活跃度是指用户在社交网络上进行活动的频繁程度,主要是通过用户的发帖、转发、评论等行为发生频率来进行计算。

目前关于社交网络的用户活跃程度的量化研究比较少。现有用户活跃度的计算主要是依据用户在单一社交平台的时间、发文数量、回复、点赞、收藏等数量,之后结合时间等因素进行加权计算。比如微博和微信等社交媒体基于自有平台的用户发文、评论及使用频度等将用户分为活跃与不活跃用户,来支撑其影响策略的制定,激活非活跃的用户。

现有活跃度计算方法存在几个方面的缺点:

(1)在现在互联网时代,每个人都使用多个社交平台,同时会在不同的社交平台上进行发帖、回复、点赞等行为,这些行为综合起来才能完整的反应一个人网络活跃度。现有的人物活跃度计算方法仅针对单一平台,计算结果无法从整体层面上衡量一个人物网络的活跃度。

(2)大部分个人用户不会在社交平台上不断发帖,更多的是处于浏览、评论或者点赞的状态,这些隐形行为也是用户活跃程度的体现。现有人物网络活跃度的计算方法一个人发帖数量、频率、本人帖子的评论数量作为主要的计算因素,忽略了频繁互动这一关键因素,导致结果与实际情况不符合。

(3)现有社交平台一般通过自身后台用户行为数据进行人物活跃度的计算,并将计算结果平台的用户黏性提升中。但是由于各个平台的数据均为隐私数据,导致基于开源数据的环境下,无法评估人物的整体的网络活跃度。

为克服相关技术中存在的问题,基于人物活跃度计算存在的问题,本方案提出了一种基于开源数据的人物网络活跃度分析方法,扩展了用户活跃度评估的维度,提升目标用户在社交网络活跃度计算的精准度;引入多社交平台的用户活跃度评估方法,解决了基于开源数据的人物整体网络活跃度无法计算的问题,弥补了人物网络活跃度综合评估的空白。所述技术方案如下:

该基于开源数据的人物网络活跃度计算方法包括以下步骤:

步骤一、依据人物活跃度的评估对象,基于人物网络活跃度的体系指标,提取各个平台上的人物社交平台数据;

步骤二、实现单平台人物的网络活跃度计算;

步骤三、取平台整体数据的时间周期与人物网络活跃度的整体时间周期保持一致,基于各平台账号数及帖子数对人物使用的各个社交平台进行权重计算;

步骤四、人员综合网络活跃度计算。

在一个实施例中,实现单平台人物的网络活跃度计算包括:

主指标,从人物的发帖数、点赞数、转发数及评论数的维度出发,能够直接反映重点人员在平台上活动频繁程度的数据;

次指标,从人物的发帖被点赞数、发帖被评论数、发帖被转发数的维度侧面反映其活动的频繁程度的数据;

主次指标的权重计算,基于各平台账号数及帖子数对人物使用的各个社交平台进行权重计算;

单平台的人物网络活跃度,基于主指标、次指标及主次指标的权重计算的方式。

在一个实施例中,所述主指标的计算方式如下:

pri_index=num_post+num_trans+num_likes+num_posts

其中,pri_index是主指标,num_post是人物发帖数,num_trans是人物转发帖子数,num_likes是人物点赞数,num_posts是人物评论数。

在一个实施例中,所述次指标的计算方式如下:

sec_index=likes*w_like+posts+transs*w_trans

其中,sec_index是次指标,likes是发帖被点赞数的均值,posts是发帖被评论数的均值,transs是发帖被转发数的均值,w_like是点赞数的调整因子,w_trans是转发数的调整因子。

在一个实施例中,所述主次指标的权重计算中设置点赞数的调整因子w_like为0.01,设置转发数的调整因子w_trans为0.1。

在一个实施例中,所述单平台的人物网络活跃度的计算方式如下:

act_plat=pri_index*0.8+sec_index*0.2

其中,主指标赋予0.8的权重,次指标赋予0.2的权重,从而体现主指标与次指标对人物网络活跃度的影响程度。

在一个实施例中,在步骤三中,平台的权重包括账号权重和帖子权重,其中,

账号权重的定义如下:

其中,w_zh平台n是平台n账号的权重,zhf平台n是平台n账号数;

帖子权重的定义如下:

其中,w-tz平台1是平台n帖子的权重,tz平台n是平台n帖子数;

最后,平台1的平台权重:

其中,w平台1是平台1的平台权重。

在一个实施例中,在步骤四中,人员综合网络活跃度计算通过n个平台活跃度的加权和计算求得,其计算公式如下:

其中,act是人物网络活跃度。

本发明的另一目的在于提供一种实现所述基于开源数据的人物网络活跃度计算方法的系统,该基于开源数据的人物网络活跃度计算系统包括:

人物社交平台数据提取单元,依据人物活跃度的评估对象,基于人物网络活跃度的体系指标,提取各个平台上的人物社交平台数据;

网络活跃度计算单元,实现单平台人物的网络活跃度计算;

权重计算单元,取平台整体数据的时间周期与人物网络活跃度的整体时间周期保持一致,基于各平台账号数及帖子数对人物使用的各个社交平台进行权重计算;

活跃度计算单元,用于实现人员综合网络活跃度计算。

本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端搭载所述基于开源数据的人物网络活跃度计算系统,并实施所述基于开源数据的人物网络活跃度计算方法。

本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:

步骤一、依据人物活跃度的评估对象,基于人物网络活跃度的体系指标,提取各个平台上的人物社交平台数据;

步骤二、实现单平台人物的网络活跃度计算;

步骤三、取平台整体数据的时间周期与人物网络活跃度的整体时间周期保持一致,基于各平台账号数及帖子数对人物使用的各个社交平台进行权重计算;

步骤四、人员综合网络活跃度计算。

本发明公开的实施例提供的技术方案可以包括以下有益效果:

本发明将人物发帖相关数据作为主指标,他人对用户的点赞、评论、转发等行为作为次指标,加入活跃度计算维度中,扩充活跃度计算维度后,更加精准的评价了人物在当前社交平台的活动频繁程度。

基于多社交平台总体发帖量及账号,计算出各平台对人物活跃度的影响权重,将人物在不同社交平台的活跃度进行归一化处理与综合计算,最终得出人物整体的网络活跃度。解决了人物整体网络活跃度无法计算的问题。

当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是本发明提供的网络活跃度指标体系架构图。

图2是本发明提供的人物网络活跃度计算流程图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。

需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本发明所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的,并不表示是唯一的实施方式。

除非另有定义,本发明所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本发明中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本发明所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

(1)该方法将人物发帖相关数据作为主指标,他人对用户的点赞、评论、转发等行为作为次指标,加入活跃度计算维度中,扩充活跃度计算维度后,更加精准的评价了人物在当前社交平台的活动频繁程度。

(2)基于多社交平台总体发帖量及账号,计算出各平台对人物活跃度的影响权重,将人物在不同社交平台的活跃度进行归一化处理与综合计算,最终得出人物整体的网络活跃度。解决了人物整体网络活跃度无法计算的问题。

如图1所示,人物网络活跃度指标体系主要从主指标、次指标及平台权重三个维度进行构建。其中主指标包括人物的发帖数、转帖数量、点赞数、评论数;次指标包括人物发帖被点赞数、发帖被评论数、发帖被转发数;平台权重主要是基于各平台账号数及帖子数对人物使用的各个社交平台进行权重计算。

人物网络活跃度是动态变化的,本方法是基于一段时间内人物在各个社交平台的数据进行计算的。

人物网络活跃度计算的主要流程如下:

依据人物活跃度的评估对象,基于人物网络活跃度的体系指标,提取各个平台上的人物社交平台数据;

单平台人物的网络活跃度计算主要分为以下几个方面:

主指标计算

主指标从人物的发帖数、点赞数、转发数及评论数等维度出发,能够直接反映重点人员在平台上活动频繁程度的数据。其计算方式如下:

pri_index=num-post+num_trans+num_likes+num_posts

其中,pri_index是主指标,num_post是人物发帖数,num_trans是人物转发帖子数,num_likes是人物点赞数,num_posts是人物评论数。

次指标计算

次指标从人物的发帖被点赞数、发帖被评论数、发帖被转发数,这些数据无法直接反映重点人员的活动频繁程度,但是从侧面一定程度上反映了其活动的频繁程度。其计算方式如下:

sec_index=likes*w_like+posts+transs*w_trans

其中,sec_index是次指标,likes是发帖被点赞数的均值,posts是发帖被评论数的均值,transs是发帖被转发数的均值。w_like是点赞数的调整因子,w_trans是转发数的调整因子。

主次指标的权重计算

通过统计facebook、twitter等多个社交平台的数据发现,一篇帖子的点赞数、分享数、评论数的量级依次递减,差距在一个量级左右,因此,通过专家研判后,设置w_like为0.01(点赞数的调整因子),w_trans为0.1(转发数的调整因子)。这样做,一方面可以平衡三者之间的量级,另一方面可以降低次指标的大小。

单平台的人物网络活跃度

基于主指标、次指标及主次指标的权重计算方式,单平台人物网络活跃度的计算方式如下:

act_plat=pri_index*0.8+sec_index*0.2

其中,主指标专家赋予0.8的权重,次指标专家赋予0.2的权重,从而体现主指标与次指标对人物网络活跃度的影响程度。

各个平台权重

每个社交平台用户基数不一样、用户发布内容的形式也不一样,在不同区域的人物使用的频繁度和依赖程度也不一样,因此,在对人物的网络活跃度进行评价时,需结合区域性特点,采用该平台涉及特定区域的用户的发帖总量和发帖账号来综合计算各个平台所占的权重。为了更准确的体现平台重要程度,我们取平台整体数据的时间周期与人物网络活跃度的整体时间周期保持一致。具体某平台的权重定义如下:

a.账号权重

其中,w_zh平台n是平台n账号的权重,zhf平台n是平台n账号数,其他同理。

b.帖子权重

其中,w-tz平台1是平台n帖子的权重,tz平台1是平台n帖子数,其他同理。

最后,平台1的平台权重:

其中,w平台1是平台1的平台权重。

人员综合网络活跃度计算

人物网络活跃度通过n个平台活跃度的加权和计算求得。其计算公式如下:

其中,act是人物网络活跃度。

本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围应由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1