新闻传播评估方法、装置、电子设备及存储介质与流程

文档序号:32743274发布日期:2022-12-30 20:27阅读:31来源:国知局
新闻传播评估方法、装置、电子设备及存储介质与流程

1.本技术涉及新闻传播技术领域,尤其涉及一种新闻传播评估方法、装置、电子设备及存储介质。


背景技术:

2.目前,随着新媒体业务的发展,除电视端外,更多的新闻也被发布到微信、微博等新媒体平台,为新闻带来了更加便捷的、多样化的传播途径的同时,也为新闻的传播力评价带来了一定的困难。
3.新闻传播力是反映新闻推广效果的重要依据。在传统的电视端,新闻的传播力主要通过收视率和观众规模等指标体现,在新媒体端,新闻的传播力主要通过阅读量等指标体现。但是,上述的指标通常是指某条特定新闻的指标,并不能评价属于某一特定新闻主题的至少一条新闻的综合传播力。


技术实现要素:

4.为解决上述技术问题,本技术实施例提供了一种新闻传播评估方法、装置、电子设备及计算机可读存储介质,能够解决相关技术不能评价属于某一特定新闻主题的至少一条新闻的综合传播力的问题。
5.本技术实施例提供了一种新闻传播评估方法,包括:
6.获取第一目标新闻在电视端的第一观众数据或/和获取第二目标新闻在新媒体端的第二观众数据;所述第一目标新闻指主题标签与目标主题标签相同的至少一条电视新闻;所述第二目标新闻指主题标签与所述目标主题标签相同的至少一条新媒体新闻;所述第一观众数据是指所述第一目标新闻在电视端的受众数据;所述第二观众数据是指所述第二目标新闻在新媒体端的传播量数据;
7.基于所述第一目标新闻在电视端的第一观众数据或/和所述第二目标新闻在新媒体端的第二观众数据,获取目标主题在电视端或/和新媒体端的传播力评价指标;所述传播力评价指标用于表征所述目标主题在电视端或/和新媒体端的传播能力。
8.本技术实施例还提供了一种新闻传播评估装置,包括:
9.观众数据获取单元,用于获取第一目标新闻在电视端的第一观众数据或/ 和获取第二目标新闻在新媒体端的第二观众数据;所述第一目标新闻指主题标签与目标主题标签相同的至少一条电视新闻;所述第二目标新闻指主题标签与所述目标主题标签相同的至少一条新媒体新闻;所述第一观众数据是指所述第一目标新闻在电视端的受众数据;所述第二观众数据是指所述第二目标新闻在新媒体端的传播量数据;
10.指标获取单元,用于基于所述第一目标新闻在电视端的第一观众数据或/ 和所述第二目标新闻在新媒体端的第二观众数据,获取目标主题在电视端或/ 和新媒体端的传播力评价指标;所述传播力评价指标用于表征所述目标主题在电视端或/和新媒体端的传播能力。
11.本技术实施例还提供了一种电子设备,包括处理器和存储器,该存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,执行如本技术实施例提供的新闻传播评估方法。
12.本技术实施例还提供了一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时,实现如本技术实施例提供的新闻传播评估方法。
13.本技术实施例提供了一种新闻传播评估方法、装置、电子设备及计算机可读存储介质,其中,所述新闻传播评估方法包括:获取第一目标新闻在电视端的第一观众数据或/和获取第二目标新闻在新媒体端的第二观众数据;所述第一目标新闻指主题标签与目标主题标签相同的至少一条电视新闻;所述第二目标新闻指主题标签与所述目标主题标签相同的至少一条新媒体新闻;所述第一观众数据是指所述第一目标新闻在电视端的受众数据;所述第二观众数据是指所述第二目标新闻在新媒体端的传播量数据;基于所述第一目标新闻在电视端的第一观众数据或/和所述第二目标新闻在新媒体端的第二观众数据,获取目标主题在电视端或/和新媒体端的传播力评价指标;所述传播力评价指标用于表征所述目标主题在电视端或/和新媒体端的传播能力。本技术实施例提供的新闻传播评估方法,通过获取目标主题对应的至少一条目标新闻所对应的观众数据的方式,获取目标新闻在电视端或/和新媒体端的传播力评价指标,进而评价属于某一特定新闻主题的至少一条新闻的综合传播力。
附图说明
14.图1为本技术实施例提供的新闻传播评估方法的流程示意图;
15.图2为本技术实施例提供的新闻主题识别模型的架构示意图;
16.图3为本技术应用示例提供的新闻传播评估方法的流程示意图;
17.图4为本技术第一应用示例提供的新闻传播评估方法的流程示意图;
18.图5为本技术第二应用示例提供的新闻传播评估方法的流程示意图;
19.图6为本技术第三应用示例提供的新闻传播评估方法的流程示意图;
20.图7为本技术实施例提供的新闻传播评估装置的结构示意图;
21.图8为本技术实施例提供的电子设备的组成示意图。
具体实施方式
22.为了能够更加详尽地了解本发明的特点与技术内容,下面结合附图对本发明的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本发明。
23.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
24.需要说明的是,本技术实施例中,术语“或/和”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a或/和b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。
25.在本技术实施例的描述中,术语“对应”可表示两者之间具有直接对应或间接对应
的关系,也可以表示两者之间具有关联关系,也可以是指示与被指示、配置与被配置等关系。
26.为便于理解本技术实施例的技术方案,以下对本技术实施例的相关技术进行说明,以下相关技术作为可选方案与本技术实施例的技术方案可以进行任意结合,其均属于本技术实施例的保护范围。
27.相关技术中,利用电视端节目的传播力评估方法,能够统计出电视端节目,如电视新闻等节目的收视率、观众规模等考核指标。但是基于电视新闻的传播力评估方法,只能针对某一条特定的电视新闻,并不能评价属于某一特定新闻主题的至少一条新闻的综合传播力。
28.且随着新媒体业务的发展,除电视端外,更多的新闻也被发布到微信、微博等新媒体平台,为新闻带来了更加便捷的、多样化的传播途径的同时,也为新闻的传播力评价带来了一定的困难。
29.为了解决上述至少部分缺陷,提出了本技术实施例的以下技术方案:
30.为了能够更加详尽地了解本技术的特点与技术内容,下面结合附图对本技术的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本技术;所描述的实施例不应视为对本技术的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
31.本技术实施例一种新闻传播评估方法,如图1所示,图1为本技术实施例提供的新闻传播评估方法的流程示意图。所述新闻评估方法包括:
32.步骤101:获取第一目标新闻在电视端的第一观众数据或/和获取第二目标新闻在新媒体端的第二观众数据;所述第一目标新闻指主题标签与目标主题标签相同的至少一条电视新闻;所述第二目标新闻指主题标签与所述目标主题标签相同的至少一条新媒体新闻;所述第一观众数据是指所述第一目标新闻在电视端的受众数据;所述第二观众数据是指所述第二目标新闻在新媒体端的传播量数据;
33.步骤102:基于所述第一目标新闻在电视端的第一观众数据或/和所述第二目标新闻在新媒体端的第二观众数据,获取目标主题在电视端或/和新媒体端的传播力评价指标;所述传播力评价指标用于表征所述目标主题在电视端或/和新媒体端的传播能力。
34.实际应用中,因为在电视端的服务器中注册的电视用户的数量庞大,因此,所有电视用户所产生的观看数据也机器庞大。以电视端的服务器为例,其保存了每日全国分钟级的电视用户的观看行为。实际应用中,在如此庞大的数据量下,为了获取所述第一目标新闻在电视端的所述第一观众数据是十分困难的。
35.为了降低获取所述第一目标新闻在电视端的所述第一观众数据的难度,实际应用中,可将电视端的服务器的物理内存作为缓存区,所述缓存区的大小优选为32gb,然后所述电视端的服务器利用分布式缓存技术存储所述电视端播放的所有电视新闻对应的电视新闻数据,及在所述电视端的服务器中注册的所有电视用户中每个电视用户的观看数据。与本地缓存相比,由于分布式缓存是独立部署的进程,拥有自身独立的内存空间,因而不会受到引用进程重启的影响。且对于缓存的数据量而言,由于不需要占用应用进程的内存空间,故而分布式缓存还能够实现大数据量的数据缓存。实际应用中,可采用memchache或 redis等分布式缓存中间件实现分布式缓存。且分布式缓存中间件可采用lazy (惰性)
expiration的最近至少使用策略,以减轻计算压力,提升计算效率。
36.进一步的,实际应用中,为了从所述电视端的服务器中获取第一目标新闻在电视端的第一观众数据,在一实施例中,所述获取第一目标新闻在电视端的第一观众数据,包括:
37.从所述电视端的服务器中获取所述第一目标新闻在电视端的电视新闻数据,所述第一目标新闻在电视端的电视新闻数据包括所述第一目标新闻在电视端的播放频道和播放时段;
38.基于所述第一目标新闻在电视端的电视新闻数据,从所述电视端的服务器中获取与所述第一目标新闻在电视端的播放频道和播放时段对应的第一观众数据。
39.在一实施例中,所述基于所述第一目标新闻在电视端的电视新闻数据,从所述电视端的服务器中获取与所述第一目标新闻在电视端的播放频道和播放时段对应的第一观众数据,包括:
40.基于在所述电视端的服务器中注册的所有电视用户,将每个电视用户的观看数据与所述第一目标新闻在电视端的电视新闻数据做对比,获取与所述第一目标新闻在电视端的播放频道和播放时段对应的第一观众数据;所述第一观众数据包括所述第一目标新闻在电视端的所有受众及每个受众的观看时段。
41.实际应用中,所述从所述电视端的服务器中获取所述第一目标新闻在电视端的电视新闻数据时,需要在所有电视新闻中确定所述第一目标新闻。由于所述第一目标新闻指主题标签与目标主题标签相同的至少一条电视新闻,因此,在一实施例中,所述从所述电视端的服务器中获取所述第一目标新闻在电视端的电视新闻数据,包括:
42.从所述电视端的服务器中获取所有电视新闻中每条电视新闻的新闻文本;
43.基于所述所有电视新闻中每条电视新闻的新闻文本,通过新闻主题识别模型,获取所述所有电视新闻中每条电视新闻对应的主题标签;
44.基于所述所有电视新闻中每条电视新闻对应的主题标签,获取与所述目标主题标签相同的主题标签所对应的第一目标新闻;
45.从所述电视端的服务器中获取所述第一目标新闻在电视端的电视新闻数据。
46.实际应用中,由于所述电视端的服务器中电视新闻数据和电视用户的观众数据的数据量庞大,因此,可利用消息队列技术所具备的解耦、异步和削峰填谷的特点获取观众数据,提高数据获取的速度和可靠性。
47.基于此,在一实施例中,所述获取与所述第一目标新闻在电视端的播放频道和播放时段对应的第一观众数据,包括:
48.利用消息队列技术获取与所述第一目标新闻在电视端的播放频道和播放时段对应的第一观众数据。
49.进一步的,随着新媒体业务的发展,除电视端外,更多的新闻也被发布到新媒体平台。但是相关技术并不能对目标主题在新媒体端的传播力进行评价。因此,为了能够获取主题标签与所述目标主题标签相同的第二目标新闻的第二观众数据,在一实施例中,所述获取所述第二目标新闻在新媒体端的第二观众数据,包括:
50.从所述新媒体端的服务器中获取与所述目标主题标签相同的主题标签所对应的第二目标新闻;
51.基于所述第二目标新闻,从所述新媒体端的服务器中获取所述第二目标新闻对应的第二观众数据。
52.实际应用中,为了获取与所述目标主题标签相同的主题标签所对应的第二目标新闻,需要将所有新媒体新闻中每条新媒体新闻的主题标签与所述目标主题标签做对比。因此,在一实施例中,所述从所述新媒体端的服务器中获取与所述目标主题标签相同的主题标签所对应的第二目标新闻,包括:
53.从所述新媒体端的服务器中获取所有新媒体新闻中每条新媒体新闻的新闻文本;
54.基于所述所有新媒体新闻中每条新媒体新闻的新闻文本,通过新闻主题识别模型,获取所述所有新媒体新闻中每条新媒体新闻对应的主题标签;
55.基于所述所有新媒体新闻中每条新媒体新闻对应的主题标签,获取与所述目标主题标签相同的主题标签所对应的第二目标新闻。
56.实际应用中,获取新媒体新闻采用的新闻主题识别模型及获取电视新闻采用的新闻主题识别模型可采用同种新闻主题识别模型,如基于textcnn、textrnn等的新闻主题识别模型。如图2所示,图2为本技术实施例提供的新闻主题识别模型的架构示意图。所述新闻主题识别模型包括:
57.嵌入层201,作为所述新闻主题识别模型的输入层,用于将指示被识别的新闻文本数据输入所述新闻主题识别模型;具体的,可将新闻文本数据转化为对应的词向量输入新闻主题识别模型;
58.卷积层202,用于基于词向量提取相应的新闻文本的特征向量;
59.池化层203,用于对所述特征向量进行压缩、降维,除去冗余信息;
60.全连接层204,用于输出识别结果。
61.实际应用中,可利用电视新闻的历史数据制作用于训练所述新闻主题识别模型的样本集,并利用样本集训练所述新闻主题识别模型。
62.实际应用中,反映新闻传播力的评价指标通常采用收视率及观众规模,本技术实施例中,为了全面的评价目标主题的传播力,所述目标主题在电视端的传播力评价指标,包括以下指标中的至少一种:
63.传播人次、传播率、人均观看时长及收视率;
64.相应的,
65.实际应用中,获取所述目标主题在电视端的传播人次,包括:
66.基于所述第一目标新闻,从所述电视端的服务器中获取与所述第一目标新闻对应的第一观众数据;
67.基于与所述第一目标新闻对应的第一观众数据,获取所述目标主题在电视端的传播人次;
68.实际应用中,所述获取与所述第一目标新闻对应的第一观众数据时,需获取所述第一目标新闻中每个电视新闻对应的第一观众数据,具体的,获取第一观众数据中的所述第一目标新闻在电视端的所有受众。基于电视常被用作家庭使用的终端,因此,每个在电视端服务器中注册的电视用户在注册时应赋予其代表的受众人数的数量,本技术实施例中,将每个电视用户代表的受众数量定义为观众权重。因此,实际应用中,所述目标主题在电视端的传播人次n,可用以下数学表达式表示:
[0069][0070]
其中,m表示所述第一目标新闻中包含m个电视新闻,j表示m个电视新闻中的第j个,n表示有n个电视用户观看了第j个电视新闻,i表示n个电视用户中的第i个电视用户,xi表示第i个电视用户的观众权重。
[0071]
实际应用中,获取所述目标主题在电视端的传播率,包括:
[0072]
基于在所述电视端的服务器中注册的所有电视用户,获取所述第一目标新闻在电视端的总推及人口;
[0073]
基于所述目标主题在电视端的传播人次,及所述第一目标新闻在电视端的总推及人口,获取所述目标主题在电视端的传播率;
[0074]
实际应用中,所述第一目标新闻在电视端的总推及人口应为所述第一目标新闻中每个电视新闻的推及人口之和。由于电视新闻通常对所有电视用户推及,因此,实际应用中,所述目标主题在电视端的传播率c,可以用以下数学表达式表示:
[0075][0076]
其中,h表示电视端的服务器中有h个电视用户注册,h表示h个电视用户中的第h个电视用户,xh表示第h个电视用户的观众权重。
[0077]
实际应用中,获取所述目标主题在电视端的人均观看时长,包括:
[0078]
基于所述与所述第一目标新闻对应的第一观众数据,获取所述第一目标新闻的所有受众的总观看时长;
[0079]
基于所述第一目标新闻的所有受众的总观看时长,及所述第一目标新闻在电视端的总推及人口,获取所述目标主题在电视端的人均观看时长;
[0080]
实际应用中,由于所述第一观众数据包括所述第一目标新闻在电视端的所有受众及每个受众的观看时段,因此,实际应用中,所述获取所述目标主题在电视端的人均观看时长t,可以用以下数学表达式表示:
[0081][0082]
其中,ti表示第i个电视用户的观看时长。
[0083]
实际应用中,获取所述目标主题在电视端的收视率,包括:
[0084]
基于所述第一目标新闻在电视端的电视新闻数据,获取所述第一目标新闻的节目时长;
[0085]
基于所述第一目标新闻的所有受众的总观看时长、所述第一目标新闻的节目时长及所述第一目标新闻在电视端的总推及人口,获取所述目标主题在电视端的收视率。实际应用中,所述目标主题在电视端的收视率q,可以用以下数学表达式表示:
[0086][0087]
其中,tj表示第j个电视新闻的节目时长。
[0088]
实际应用中,所述目标主题在新媒体端的传播力评价指标包括所述目标主题在新媒体端的总阅读量;
[0089]
相应的,
[0090]
获取所述目标主题在新媒体端的总阅读量,包括:
[0091]
基于所述第二目标新闻在新媒体端的第二观众数据,获取所述目标主题在新媒体端的总阅读量l。其中,所述目标主题在新媒体端的总阅读量l包括所述第二目标新闻中每一个新媒体新闻的阅读量之和。
[0092]
实际应用中,所述目标主题在电视端和新媒体端的传播力评价指标包括目标主题在电视端和新媒体端的总传播人次;
[0093]
相应的,
[0094]
获取所述目标主题在电视端和新媒体端的总传播人次,包括:
[0095]
基于所述第一观众数据,获取所述目标主题在电视端的传播人次;
[0096]
基于所述第二观众数据,获取所述目标主题在新媒体端的总阅读量;
[0097]
基于所述目标主题在电视端的传播人次和所述目标主题在新媒体端的总阅读量,获取所述目标主题在电视端和新媒体端的总传播人次。
[0098]
实际应用中,所述目标主题在电视端和新媒体端的总传播人次指所述目标主题在电视端的传播人次和所述目标主题在新媒体端的总阅读量之和。
[0099]
本技术实施例提供了一种新闻传播评估方法,包括:获取第一目标新闻在电视端的第一观众数据或/和获取第二目标新闻在新媒体端的第二观众数据;所述第一目标新闻指主题标签与目标主题标签相同的至少一条电视新闻;所述第二目标新闻指主题标签与所述目标主题标签相同的至少一条新媒体新闻;所述第一观众数据是指所述第一目标新闻在电视端的受众数据;所述第二观众数据是指所述第二目标新闻在新媒体端的传播量数据;基于所述第一目标新闻在电视端的第一观众数据或/和所述第二目标新闻在新媒体端的第二观众数据,获取目标主题在电视端或/和新媒体端的传播力评价指标;所述传播力评价指标用于表征所述目标主题在电视端或/和新媒体端的传播能力。
[0100]
本技术实施例提供的新闻传播评估方法,通过获取目标主题对应的至少一条目标新闻所对应的观众数据的方式,获取目标新闻在电视端或/和新媒体端的传播力评价指标,进而评价属于某一特定新闻主题的至少一条新闻的综合传播力,弥补了相关技术中关于新闻主题传播力评价的技术空白。
[0101]
图3为本技术应用示例提供的新闻传播评估方法的流程示意图,如图3所示,本技术应用示例提供的新闻传播方法,包括以下步骤:
[0102]
步骤301:利用分布式缓存技术存储所有电视新闻对应的电视新闻数据及所有电视用户对应的观看数据;具体的,
[0103]
电视端的服务器利用分布式缓存技术在存储所述电视端播放的所有电视新闻对应的电视新闻数据,及在所述电视端的服务器中注册的所有电视用户中每个电视用户的观看数据;其中,分布式缓存中间件采用lazy expiration的最近至少使用策略;
[0104]
实际应用中,所述新闻数据可包括电视新闻播放频道、电视新闻开始时间、电视新闻结束时间等。
[0105]
进一步的,如需获得每个电视用户的观看数据,需此电视用户已在电视端的服务器注册。电视用户的观看数据指在电视端的服务器注册的每个电视用户的观看数据,其中包括与所述第一目标新闻对应的第一观众数据。
[0106]
每个电视用户的观看数据由两部分组成,用户数据和用户观看数据;所述用户数据可包括用户编号(在电视端服务器的注册编号)、用户权重、用户地域、用户年龄、用户性别等。所述用户观看数据可包括用户观看频道、用户观看日期、用户开始观看时间、用户结束观看时间等。
[0107]
步骤302:识别电视新闻或/和新媒体新闻的主题标签;具体的,
[0108]
通过新闻主题识别模型,获取所述所有电视新闻中每条电视新闻对应的主题标签,或/和获取所述所有新媒体新闻中每条新媒体新闻对应的主题标签;
[0109]
实际应用中,所述新闻主题识别模型可通过历史新闻数据训练,例如:新闻文本为“火箭队与魔术队的比分为115:110
……”
,则其对应的主题标签为“nba”,新闻文本为“今日由利物浦对阵皇马......”,则其对应的主题标签为“欧冠”,新闻文本为“可再生能源建设提速绿色发展动力强劲
……”
,则其对应的主题标签为“新能源”。实际应用中,优选的应获取不少于300万条新闻文本及其对应的主题标签,作为训练新闻主题识别模型的样本集。
[0110]
步骤303:获取与目标主题对应的第一目标新闻或/和第二目标新闻;具体的,
[0111]
基于所有电视新闻中每条电视新闻对应的主题标签,或/和所有新媒体新闻中每条新媒体新闻对应的主题标签,从电视端的服务器中获取所述第一目标新闻,或/和从新媒体端的服务器中获取所述第二目标新闻;
[0112]
步骤304:获取与第一目标新闻或/和第二目标新闻对应的第一观众数据或/ 和第二观众数据;具体的,
[0113]
利用消息队列技术从电视端的服务器中获取与所述第一目标新闻在电视端的播放频道和播放时段对应的第一观众数据,或/和从新媒体端的服务器中获取与所述第二目标新闻对应的第二观众数据;
[0114]
实际应用中,可利用部署在解析服务器节点中的解析函数,将所述第一观众数据和第二观众数据生成为kafka消息,并将kafka消息保存在memchache。
[0115]
步骤305:获取目标主题的传播力评价指标;具体的,
[0116]
基于所述第一目标新闻在电视端的第一观众数据或/和所述第二目标新闻在新媒体端的第二观众数据,获取目标主题在电视端或/和新媒体端的传播力评价指标。
[0117]
其中,上述目标主题在电视端或/和新媒体端的传播力评价指标包括:
[0118]
所述目标主题在电视端的传播人次、传播率、人均观看时长及收视率,所述目标主题在在新媒体端的总阅读量,所述目标主题在电视端和新媒体端的总传播人次。
[0119]
上述目标主题在电视端或/和新媒体端的传播力评价指标还包括目标主题在电视端的主题份额,获取所述目标主题在电视端的主题份额,包括:
[0120]
获取目标主题在电视端的收视率;
[0121]
获取所有主题中每一主题在电视端的收视率;
[0122]
基于所述目标主题在电视端的收视率及每一主题在电视端的收视率,得到所述目标主题在电视端的主题份额。其中所述目标主题在电视端的主题份额的计算方式为:目标主题在电视端的收视率与所有主题中每一主题在电视端的收视率之和的比值。
[0123]
下面结合应用示例对本技术实施例的技术方案进行举例说明。
[0124]
第一应用实例:
[0125]
如图4所示,图4为本技术第一应用示例提供的新闻传播评估方法的流程示意图。本技术第一应用示例提供的新闻传播评估方法,包括以下步骤:
[0126]
步骤401:利用分布式缓存技术存储所有电视新闻对应的电视新闻数据及所有电视用户对应的观看数据;具体的,
[0127]
其中,每个电视用户的观看数据由两部分组成,分别为用户数据和用户观看数据。
[0128]
所述用户数据可采用以下格式保存:
[0129]
audience_data={id:001,sex:female,age:12,area:beijing,weight:23};
[0130]
其中,id:001表示示例的电视用户在电视端的服务器中注册编号为001, sex:female表示注册编号为001的电视用户为女性用户,age:12表示注册编号为 001的电视用户的年龄为12岁,area:beijing表示注册编号为001的电视用户的注册地址为北京市,weight:23表示注册编号为001的观众权重为23;
[0131]
用户观看数据可采用以下格式保存:
[0132]
behavior_data={channel_id:002,audience_id:001,date:"2021-12-3",start_time: "12:30:00",end_time:"12:45:00"};
[0133]
其中,audience_id:001表示此条用户观看数据为注册编号为001的电视用户的观看数据,channel_id:002表示注册编号为001的电视用户观看的是002频道,,date"2021-12-3"表示注册编号为001的电视用户观看002频道的日期为 2021-12-3,start_time:"12:30:00"及end_time:"12:45:00"分别表示注册编号为001 的电视用户观看002频道的起止时间。
[0134]
所述电视新闻数据可采用与用户数据和用户观看数据相似的格式保存,以单条电视新闻数据为例,其保存的数据包含电视新闻播放频道、电视新闻主要内容、电视新闻开始时间、电视新闻结束时间。
[0135]
实际应用中,新媒体新闻,以微信新闻为例,其微信新闻数据通常采用以下格式保存:
[0136]
wx_data={title:"太空出差三人组今晚和大家一起看春晚",platform:"cctvnewcenter",date:"2021-12-3",time:"12:30:00",read_num:100032,sha re_num:1032,like_num:3432,watching_num:432};
[0137]
其中,title:"太空出差三人组今晚和大家一起看春晚"表示微信新闻的标题为太空出差三人组今晚和大家一起看春晚,platform:"cctvnewcenter"表示传播此条微信新闻的微信号为cctvnewcenter,date:"2021-12-3"表示传播此条微信新闻的日期为2021-12-3,time:"12:30:00"表示传播此条微信新闻的时间, read_num:100032、share_num:1032、like_num:3432、watching_num:432分别表示此条微信新闻在微信端的阅读量、分享量、收
藏量和正在阅读量。
[0138]
其中,上述用户数据、用户观看数据、电视新闻数据和新媒体新闻数据均可利用部署在解析服务节点中的解析函数,将上述数据生产为kafka消息,具体的,可采用以下程序语言实现:
[0139]
parse_data(wx_data2021-12-3.txt);
[0140]
producer=kafkaproducer(bootstrap_servers='10.10.33.8:8088')
[0141]
msg=json.dumps(wx_data)
[0142]
producer.send('wx_data_topic',msg,partition=0)
[0143]
producer.close()
[0144]
然后消费kafka消息并保存在memchache,具体的,可采用以下程序语言实现:
[0145]
consumer=kafkaconsumer('wx_data_topic',
[0146]
bootstrap_servers=['10.10.33.8:8088'])
[0147]
for msg in consumer:
[0148]
mc=memcache.client(['10.10.33.9'])
[0149]
mc.set(msg.key,msg.value)
[0150]
上述保存在memchache中的数据可供后续方法步骤使用。
[0151]
步骤402:训练新闻主题识别模型,通过新闻主题识别模型识别电视新闻或/和新媒体新闻的主题标签;具体的,
[0152]
准备至少300万条新闻内容及其对应的主题标签,作为样本集;例如,新闻文本为“火箭队与魔术队的比分为115:110
……”
,则其对应的主题标签为“nba”,新闻文本为“今日由利物浦对阵皇马......”,则其对应的主题标签为“欧冠”,新闻文本为“可再生能源建设提速绿色发展动力强劲
……”
,则其对应的主题标签为“新能源”。
[0153]
将样本集中的样本通过wordv2vec转换成词向量,原始数据要去掉特殊符号,通过分词工具生成train.txt文件;具体的,可采用以下程序语言实现:
[0154]
train_data=open('train.txt','rb')
[0155]
model=word2vec(linesentence(train_data),sg=1,size=10,window=7, min_count=4,workers=13,sample=1e-3)
[0156]
model.save('model.word2vec')
[0157]
将上述数据作为输入数据进行embedding映射进入嵌入层,通过卷积处理进入卷积层,对卷积结果取最大值,通过最大池化进入池化层,最后拼接一层全连接层。具体的,可采用以下程序语言实现:
[0158]
##通过处理的取得词向量,lenth为向量词长度,train_data_num为向量词的总数
[0159]
self.embed=nn.embedding(train_data_num,length)
[0160]
##卷积层,channel_num为channel数,knum为卷积核的数量
[0161]
self.convs=nn.modulelist([nn.conv2d(channel_num,knum,(k,length))for k in ks])
[0162]
self.dropout=nn.dropout(args.dropout)
[0163]
##全连接层,class_num为分类的数量
[0164]
self.fc=nn.linear(len(ks)*knum,class_num)
[0165]
新闻主题识别模型训练好后,保存模型。具体的,可采用以下程序语言实现:
[0166]
model.save('tag.model')
[0167]
实际应用中,可将训练好的新闻主题识别模型保存在电视端或者新媒体端的服务器中,需要使用时直接调用。
[0168]
实际应用中,本技术第一应用实施中涉及的程序语言可以采用各种计算机语言实现。例如,面向对象的程序设计语言java、python、javascript等。
[0169]
步骤403:获取与目标主题在电视端对应的第一目标新闻或/和在新媒体端第二目标新闻;
[0170]
步骤404:获取与第一目标新闻或/和第二目标新闻对应的第一观众数据或/ 和第二观众数据;
[0171]
步骤405:获取目标主题在电视端或/和新媒体端的传播力评价指标。
[0172]
其中,本技术
[0173]
第二应用实例:
[0174]
如图5所示,图5为本技术第二应用示例提供的新闻传播评估方法的流程示意图,本技术第二应用示例的目的为获取目标主题在电视端的传播力评价指标。本技术第二应用示例提供的新闻传播评估方法,包括以下步骤:
[0175]
步骤501:利用分布式缓存技术存储所有电视新闻对应的电视新闻数据及所有电视用户对应的观看数据;
[0176]
步骤502:训练新闻主题识别模型,通过新闻主题识别模型识别电视新闻的主题标签;
[0177]
步骤503:获取与目标主题在电视端对应的第一目标新闻,具体的:
[0178]
实际应用中,可基于预设的目标主题及对应的评价日期,在电视端的服务器中获取其对应的第一目标新闻,以主题标签为nba,评价日期为2021-12-3 为例,可采用以下程序语言实现:
[0179]
news_data=get_data_by_tag('2021-12-3','nba')
[0180]
步骤504:获取与第一目标新闻对应的第一观众数据,具体的:
[0181]
根据第一目标新闻中每条电视新闻对应的播放日期、播放频道和播放起止时间,在电视端的服务器中获取第一目标新闻对应的第一观众数据,可采用以下程序语言实现:
[0182]
audience=get_audience_by_news_data(news_data)
[0183]
其中,若第一目标新闻中不同的电视新闻对应的受众的电视用户编号可能出现重复的情况,则可基于所有受众,依据其对应的电视用户编号进行排重,排重时剔除的电视用户机器对应的电视新闻均不参与最终的传播力评价指标的计算,具体的排重可采用以下程序语言实现:
[0184]
audience=distinct_id_audience(audience)
[0185]
步骤505:获取目标主题在电视端的传播力评价指标,具体的,本技术第二应用示例中以获取所述目标主题在电视端的传播率为例进行说明;
[0186]
假定第一目标新闻中含有一条电视新闻,其对应的第一观众数据如表1所示,表1为本技术第二应用示例提供的第一观众数据表:
[0187]
电视用户编号观众权重
00120023
[0188]
表1本技术第二应用示例提供的第一观众数据表
[0189]
因此,所述目标主题在电视端的传播人次
[0190]
将上述目标主题在电视端的传播人次n与目标主题在电视端的总推及人口作比,其结果即为所述目标主题在电视端的传播率。
[0191]
第三应用实例:
[0192]
如图6所示,图6为本技术第三应用示例提供的新闻传播评估方法的流程示意图,本技术第三应用示例的目的为获取目标主题在电视端和新媒体端的传播力评价指标。本技术第三应用示例提供的新闻传播评估方法,包括以下步骤:
[0193]
步骤601:利用分布式缓存技术存储所有电视新闻对应的电视新闻数据及所有电视用户对应的观看数据;
[0194]
步骤602:训练新闻主题识别模型,通过新闻主题识别模型识别电视新闻和新媒体新闻的主题标签;
[0195]
步骤603:获取与目标主题在电视端对应的第一目标新闻和在新媒体端对应的第二目标新闻;
[0196]
步骤604:获取与第一目标新闻对应的第一观众数据和与第二目标新闻对应的第二目标数据;
[0197]
步骤605:获取目标主题在电视端和新闻媒体端的传播力评价指标,具体的,本技术第三应用示例中以获取所述目标主题在电视端和新媒体端的总传播人次为例进行说明;
[0198]
所述目标主题在电视端和新媒体端的总传播人次为所述目标主题在电视端的传播人次和所述目标主题在新媒体端的总阅读量之和。
[0199]
为了实现本技术实施例提供的新闻传播评估方法,本技术实施例还提供一种新闻传播评估装置,设置在电子设备上。图7为本技术实施例提供的新闻传播评估装置的结构示意图,如图7所示,所述新闻传播评估装置700,包括:
[0200]
观众数据获取单元701,用于获取第一目标新闻在电视端的第一观众数据或/和获取第二目标新闻在新媒体端的第二观众数据;所述第一目标新闻指主题标签与目标主题标签相同的至少一条电视新闻;所述第二目标新闻指主题标签与所述目标主题标签相同的至少一条新媒体新闻;所述第一观众数据是指所述第一目标新闻在电视端的受众数据;所述第二观众数据是指所述第二目标新闻在新媒体端的传播量数据;
[0201]
指标获取单元702,用于基于所述第一目标新闻在电视端的第一观众数据或/和所述第二目标新闻在新媒体端的第二观众数据,获取目标主题在电视端或 /和新媒体端的传播力评价指标;所述传播力评价指标用于表征所述目标主题在电视端或/和新媒体端的传播能力。
[0202]
实际应用中,所述观众数据获取单元701,具体用于,
[0203]
从所述电视端的服务器中获取所述第一目标新闻在电视端的电视新闻数据,所述第一目标新闻在电视端的电视新闻数据包括所述第一目标新闻在电视端的播放频道和播放时段;
[0204]
基于所述第一目标新闻在电视端的电视新闻数据,从所述电视端的服务器中获取与所述第一目标新闻在电视端的播放频道和播放时段对应的第一观众数据。
[0205]
所述观众数据获取单元701,还具体用于,
[0206]
从所述电视端的服务器中获取所有电视新闻中每条电视新闻的新闻文本;
[0207]
基于所述所有电视新闻中每条电视新闻的新闻文本,通过新闻主题识别模型,获取所述所有电视新闻中每条电视新闻对应的主题标签;
[0208]
基于所述所有电视新闻中每条电视新闻对应的主题标签,获取与所述目标主题标签相同的主题标签所对应的第一目标新闻;
[0209]
从所述电视端的服务器中获取所述第一目标新闻在电视端的电视新闻数据。
[0210]
所述观众数据获取单元701,还具体用于,
[0211]
基于在所述电视端的服务器中注册的所有电视用户,将每个电视用户的观看数据与所述第一目标新闻在电视端的电视新闻数据做对比,获取与所述第一目标新闻在电视端的播放频道和播放时段对应的第一观众数据;所述第一观众数据包括所述第一目标新闻在电视端的所有受众及每个受众的观看时段。
[0212]
所述观众数据获取单元701,还具体用于,
[0213]
从所述新媒体端的服务器中获取与所述目标主题标签相同的主题标签所对应的第二目标新闻;
[0214]
基于所述第二目标新闻,从所述新媒体端的服务器中获取所述第二目标新闻对应的第二观众数据。
[0215]
所述观众数据获取单元701,还具体用于,
[0216]
从所述新媒体端的服务器中获取所有新媒体新闻中每条新媒体新闻的新闻文本;
[0217]
基于所述所有新媒体新闻中每条新媒体新闻的新闻文本,通过新闻主题识别模型,获取所述所有新媒体新闻中每条新媒体新闻对应的主题标签;
[0218]
基于所述所有新媒体新闻中每条新媒体新闻对应的主题标签,获取与所述目标主题标签相同的主题标签所对应的第二目标新闻。
[0219]
所述观众数据获取单元701,还具体用于,
[0220]
利用消息队列技术获取与所述第一目标新闻在电视端的播放频道和播放时段对应的第一观众数据。
[0221]
实际应用中,所述新闻传播评估装置700还包括缓存单元,所述缓存单元用于,
[0222]
利用分布式缓存技术存储所述电视端播放的所有电视新闻对应的电视新闻数据,及在所述电视端的服务器中注册的所有电视用户中每个电视用户的观看数据。
[0223]
实际应用中,所述指标获取单元702,具体用于,
[0224]
获取所述目标主题在电视端的传播人次,包括:
[0225]
基于所述第一目标新闻,从所述电视端的服务器中获取与所述第一目标新闻对应的第一观众数据;
[0226]
基于与所述第一目标新闻对应的第一观众数据,获取所述目标主题在电视端的传播人次;
[0227]
获取所述目标主题在电视端的传播率,包括:
[0228]
基于在所述电视端的服务器中注册的所有电视用户,获取所述第一目标新闻在电
视端的总推及人口;
[0229]
基于所述目标主题在电视端的传播人次,及所述第一目标新闻在电视端的总推及人口,获取所述目标主题在电视端的传播率;
[0230]
获取所述目标主题在电视端的人均观看时长,包括:
[0231]
基于所述与所述第一目标新闻对应的第一观众数据,获取所述第一目标新闻的所有受众的总观看时长;
[0232]
基于所述第一目标新闻的所有受众的总观看时长,及所述第一目标新闻在电视端的总推及人口,获取所述目标主题在电视端的人均观看时长;
[0233]
获取所述目标主题在电视端的收视率,包括:
[0234]
基于所述第一目标新闻在电视端的电视新闻数据,获取所述第一目标新闻的节目时长;
[0235]
基于所述第一目标新闻的所有受众的总观看时长、所述第一目标新闻的节目时长及所述第一目标新闻在电视端的总推及人口,获取所述目标主题在电视端的收视率。
[0236]
实际应用中,所述指标获取单元702,还具体用于,
[0237]
获取所述目标主题在新媒体端的总阅读量,包括:
[0238]
基于所述第二目标新闻在新媒体端的第二观众数据,获取所述目标主题在新媒体端的总阅读量。
[0239]
实际应用中,所述指标获取单元702,还具体用于,
[0240]
获取所述目标主题在电视端和新媒体端的总传播人次,包括:
[0241]
基于所述第一观众数据,获取所述目标主题在电视端的传播人次;
[0242]
基于所述第二观众数据,获取所述目标主题在新媒体端的总阅读量;
[0243]
基于所述目标主题在电视端的传播人次和所述目标主题在新媒体端的总阅读量,获取所述目标主题在电视端和新媒体端的总传播人次。
[0244]
本领域技术人员应当理解,图7中所示的新闻传播评估装置700中的各单元的实现功能可参照前述的新闻传播评估方法的相关描述而理解。图7所示的新闻传播评估装置700中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
[0245]
需要说明的是:上述实施例提供的新闻传播评估装置400在进行新闻传播评估时,仅以上述各程序单元的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序单元完成,即将系统的内部结构划分成不同的程序单元,以完成以上描述的全部或者部分处理。另外,上述实施例提供的新闻传播评估装置700与新闻传播评估方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0246]
基于上述程序单元的硬件实现,且为了实现本技术实施例提供的话单测试方法,本技术实施例还提供一种电子设备。图8为本技术实施例提供的电子设备的组成示意图。所述电子设备800,包括处理器801和存储器802,该存储器 802用于存储计算机程序,所述处理器801用于调用并运行所述存储器中存储的计算机程序,执行如本技术实施例提供的新闻传播评估方法的方法步骤。
[0247]
实际应用时,如图8所示,所述电子设备800中的各个组件通过总线模块 803耦合在一起。可理解,总线模块803用于实现这些组件之间的连接通信。总线模块803除包括数据
总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图8中将各种总线都标为总线模块803。
[0248]
本技术实施例还提供一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时,实现本技术实施例提供的新闻传播评估方法的方法步骤。
[0249]
在一些实施例中,计算机可读存储介质可以是磁性随机存取存储器 (fram,ferromagneticrandom access memory)、只读存储器(rom,read onlymemory)、可编程只读存储器(prom,programmable read-only memory)、可擦除可编程只读存储器(eprom,erasableprogrammable read-only memory)、电可擦除可编程只读存储器(eeprom,electricallyerasable programmableread-only memory)、快闪存储器(flash memory)、磁表面存储器、光盘、或只读光盘(cd-rom,compact disc read-only memory)等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
[0250]
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
[0251]
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言 (html,hyper textmarkup language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
[0252]
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
[0253]
需要说明的是:“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[0254]
本技术实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
[0255]
在本技术所提供的几个实施例中,应该理解到,所揭露的方法和电子设备,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
[0256]
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
[0257]
另外,在本技术各实施例中的各功能单元可以全部集成在一个第二处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0258]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1