一种消费品舆情互联网影响力指数评价方法与流程

文档序号:24532141发布日期:2021-04-02 10:11阅读:216来源:国知局
一种消费品舆情互联网影响力指数评价方法与流程

【技术领域】

本发明涉及网络信息分析评价方法,尤其涉及一种消费品在互联网的舆情监测及评价方法。



背景技术:

随着互联网技术的普及与发展,网络媒体由于自身传播手段多样、互动性强等优点,逐渐成为新闻传播载体之一;而伴随着互联网用户的增多以及中国消费品工业的进步,使得网络媒体迅速发展起来,消费者也可以通过网络媒体平台上投诉消费品缺陷,形成维权联盟,进而保护自己的合法权益。

目前针对消费品维权用户在网络传播中发布的信息所形成的影响力的监测及评估方法,主要是通过网络爬虫(一种按照一定的规则,自动地抓取互联网信息的程序或者脚本)等手段针对某一个网络媒体平台抓取其上用户发布的信息,来判断出某一品牌的某一款产品所造成的缺陷在网络传播中形成的影响力的大小,进而获知该类产品造成的缺陷对我国消费者人身、财产权益带来的威胁程度,从而保护消费者的权益;然而,现有的通过评估用户在网络传播中发布的信息所形成的影响力来反映消费品缺陷所形成的影响大小的方法,由于每次为评估提供用户发布信息的信息源及对用户发布的信息所采用的评估指标均过于单一,导致用户发布的信息采集不全面,制定的评估指标与多个信息源的匹配度较差,进而使得评估结果带有一定的偏见性,不能真实地反映出某类产品缺陷在网络传播中所形成的影响力的大小。

有鉴于此,本发明提供了一种针对消费品缺陷发布的信息的数据收集、处理、监测及分析方法,解决了现有评估方法中信息采集不全面,评估指标与多个信息源的匹配度较差的技术问题。



技术实现要素:

本发明要解决的技术问题是,提供一种信息收集全面、监测及分析维度广的消费品舆情互联网影响力指数评价方法。

为解决上述技术问题,本发明采用以下技术方案:一种消费品舆情互联网影响力指数评价方法,其特征在于包括以下步骤:

step1:在映射函数中输入目标相关的关键词,所述关键词为拟评价的品牌名称、产品种类名、产品质量故障种类名,检索公式为:关键词之间添加“和”或“与”;

step2:采用映射函数对输入的关键词进行映射处理,得关键词集合,映射函数所采用的映射数据为历史积累的与消费品缺陷描述相关联的词汇;

step3:将新浪微博、小红书、腾讯微博、微信平台归为微博类平台,将黑猫投诉平台、消费质量网归属为网媒平台;

step4:将step2得到的关键词集合,采用网络爬虫在微博类平台中查找,并爬取命中符合关键词集合的所有信息,并将这些信息存储在服务器,作为微博信息;

step5:采集step4所得微博信息中的微博描述性信息,所述微博描述性信息为发布微博的用户信息、用户粉丝数、微博的转发数、微博的点赞数;

step6:利用step5所得的微博描述性信息计算出微博类平台影响力值,计算公式如下:

其中norm()函数的具体计算公式为:

公式中的t为网络影响力指标向量所包含的fwfansk,fwforwardsk,fwthumbk中的任意一个;fwfansk为单个用户的粉丝数量,fwforwardsk为单条微博信息的转发数量,fwthumbk为单条微博信息的点赞数量;a为粉丝数量的权重,a的数值范围为0.26~0.32,1-a为信息质量的权重;i(fw)为微博类平台影响力值;e为自然常数,为数学中一个常数,是一个无限不循环小数,且为超越数,其值约为2.718;

step7:将step2得到的关键词集合,采用网络爬虫在网媒平台中查找,并爬取命中符合关键词集合的所有信息,并将这些信息存储在服务器,作为网媒信息;

step8:采集step7所得网媒信息中的网媒描述性信息,所述网媒描述性信息为网站的名称、url、网站的浏览统计数据和搜索引擎数据、信息本身的标题时间;

step9:根据step8所得网媒描述性信息中的网站名称,采用网络爬虫抓取各网站的百度指数并做网站排名;根据根据step8所得网媒描述性信息赋予各网站相关度等级评定指数0-10,等级评定指数的数值越大,则表示这个网站与相关行业的相关性越大;

step10:根据step9获得的网站排名和网站相关度等级评定指数计算网媒平台影响力值,计算公式如下:

其中fnprk即为百度指数,fnrankk为网站相关度等级评定指数;b为百度指数权重,b的数值范围为0.68~0.75,1-b为网站相关度等级评定指数的权重;i(fn)为网媒平台影响力值;

step11:按以下公式计算拟评价的品牌名称、产品种类名、产品质量故障种类名的网络影响力总值i(f)=c*i(fw)+(1-c)*i(fn),其中c为微博类平台影响力值的权重,c的数值范围为0.44~0.512,1-c为网媒平台影响力值的权重。

本发明在影响力的评价指标上主要从传播的广度和深度两个方面来衡量事件传播的影响力的大小。

所谓的广度是指事件传播的吸引和集聚受众注意力的环节,媒体通过各种平台的报道扩大其影响范围,事件能够在多大程度上引起受众的注意,能够吸引多少受众的注意和接触,这是形成传播影响力至关重要的一个环节,衡量这一环节的指标就是受众规模。而深度是指受众根据自己的需求对传播信息进行选择性地理解,记忆。受众对事件的接受程度越高,说明事件的影响力越大。从广度和深度两个角度来对事件的传播影响力进行客观评估可以合理的评估事件的影响力大小。

对于传播影响力模型的广度因子和深度因子,评价维度上主要从微博类平台的粉丝数、转发数、评论数和网媒平台的百度指数、权威指数这两个平台的维度来衡量。

以新浪微博平台的事件传播影响力评价为例,能够反应广度因子的指标有该事件的相似新闻数,微博用户的粉丝量。能够反应深度因子的指标有转发数,评论数。通过对4个指标量进行数据标准化转换,将其转换为一定区间内标准化量,从而得到评价事件传播影响力的广度因子和深度因子。网媒平台可同样从广度和深度做类似的操作其中主要评估反应网站流量的谷歌pr值和反应行业相关性的权威指数。

影响力模型基于传播广度、传播深度两种评价维度建立事件新闻传播影响力模型。本模型将传播广度、传播深度进行融合,定义事件信息传播影响力为所有同类消息发布一段时间后,消息传播广度和消息传播深度的加权求和。

传播广度(iw):指的是事件发生后,消息传播的受众规模本模型主要定义为微博个体用户的粉丝数和网媒网站平台的百度权重值。

传播深度(id):传播深度与传统定义方式的传播路径深度不同,本模型考虑的是一类事件的传播影响力而不是个体微博新闻的传播,将深度定义为传播受众对新闻的接受和反应程度;以微博的转发、评论为代表。

本发明与现有技术相比,提供了一种针对产品缺陷发布的信息的数据收集、监测及处理方法,通过将输入指令中包含了消费品的品牌、产品类型以及故障类型的关键词进行映射处理,获得对应关键词集合,方便在不同的网络媒体平台上进行信息搜索,扩大了用户发布信息的采集范围,避免信息遗漏,之后,依据所述关键词集合,在多个网络媒体平台上分别获取各自的信息集合,增加了为评估提供用户发布信息的信息来源,从多个网络媒体平台的信息集合中分别确定出各自对应的网络影响力指标向量集合,进而实现了在不需人工参与的情况下完成对用户发布信息的自动聚集、分析计算,得出可量化的网络影响力评估指标,达到了针对不同的网络媒体平台制定不同评估指标的目的,解决了因评估指标单一而导致的评估指标与多个信息源匹配度较差的问题,同时降低了计算得出的产品缺陷的网络影响力值的偏见性,使其能够较为真实地反映出某类产品缺陷在网络传播中所形成的影响力的大小。

综上所述,本发明具有信息收集全面、监测及分析维度广,能真实反应拟评价的品牌名称、产品种类名、产品质量故障种类名互联网舆情影响力的有益效果。

【附图说明】

图1为本发明信息流流向示意图。

【具体实施方式】

如图1所示,一种消费品舆情互联网影响力指数评价方法,其特征在于包括以下步骤:

step1:想要获知的是关于“凯旋电动车”存在的“超速失控”的缺陷在当前网络舆论中所造成的影响力的大小,在映射函数中输入“凯旋牌+电动自行车+超速失控”;

step2:采用映射函数对输入的关键词进行映射处理,得关键词集合“凯旋牌”、“电动自行车”、“超速失控”“太快刹不住”、“刹车刹不住”、“速度太快停不下”等词汇,便于扩大搜索范围,映射函数所采用的映射数据为历史积累的与消费品缺陷描述相关联的词汇;

step3:将新浪微博、小红书、腾讯微博、微信平台归为微博类平台,将黑猫投诉平台、消费质量网归属为网媒平台;

step4:将step2得到的关键词集合,采用网络爬虫在微博类平台中查找,并爬取命中符合关键词集合的所有信息,获得382条微博信息,并将这些信息存储在服务器;

step5:采集step4所得微博信息中的微博描述性信息,所述微博描述性信息为发布微博的用户信息、用户粉丝数、微博的转发数、微博的点赞数,总计3822条信息;

step6:利用step5所得的微博描述性信息计算出微博类平台影响力值,计算公式如下:

其中norm()函数的具体计算公式为:公式中的t为网络影响力指标向量所包含的fwfansk,fwforwardsk,fwthumbk中的任意一个;fwfansk为单个用户的粉丝数量,fwforwardsk为单条微博信息的转发数量,fwthumbk为单条微博信息的点赞数量;a为粉丝数量的权重,a的数值为0.26~0.32,1-a为信息质量的权重;i(fw)为微博类平台影响力值;e为自然常数,为数学中一个常数,是一个无限不循环小数,且为超越数,其值约为2.718;

step7:将step2得到的关键词集合,采用网络爬虫在网媒平台中查找,并爬取命中符合关键词集合的所有信息,并将这些信息存储在服务器,作为网媒信息,共计90条;

step8:采集step7所得网媒信息中的网媒描述性信息,所述网媒描述性信息为网站的名称、url、网站的浏览统计数据和搜索引擎数据、信息本身的标题时间;

step9:根据step8所得网媒描述性信息中的网站名称,采用网络爬虫抓取各网站的百度指数并做网站排名;根据根据step8所得网媒描述性信息赋予各网站相关度等级评定指数0-10,等级评定指数的数值越大,则表示这个网站与相关行业的相关性越大;

step10:根据step9获得的网站排名和网站相关度等级评定指数计算网媒平台影响力值,计算公式如下:

其中fnprk即为百度指数,fnrankk为网站相关度等级评定指数;b为百度指数权重,b的数值为0.68~0.75,1-b为网站相关度等级评定指数的权重;i(fn)为网媒平台影响力值;

step11:按以下公式计算“凯旋电动车”存在的“超速失控”的缺陷在当前网络舆论中所造成的影响力总值i(f)=c*i(fw)+(1-c)*i(fn),其中c为微博类平台影响力值的权重,c的数值为0.44~0.512,1-c为网媒平台影响力值的权重。“凯旋电动车”存在的“超速失控”的缺陷在当前网络舆论中所造成的影响力总值为i(f)。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1