一种基于大数据的信息智能分析方法与流程

文档序号:32337692发布日期:2022-11-26 08:37阅读:30来源:国知局
一种基于大数据的信息智能分析方法与流程

1.本发明涉及信息智能分析技术领域,具体为一种基于大数据的信息智能分析方法。


背景技术:

2.媒体新闻报道在促进经济社会协调发展过程中起着十分重要的作用。社会是一个有机的整体,媒体新闻报道是反映社会发展状况的重要渠道。
3.媒体机构所报道新闻信息,都是采集到大量的所要报道的社会信息后,由媒体机构相关工作人员进行人工筛选整理后,进一步整理需报道的重点信息,并以重点信息为中心梳理构建为热点信息文章进行发表或报道。但是通过人工对采集到的信息进行筛选整理过程中,易存在信息遗漏等问题,且筛选整理效率低下,严重影响媒体机构的媒体新闻报道速度及报道质量。因此,设计可智能对信息分析整理及实用性强的一种基于大数据的信息智能分析方法是很有必要的。


技术实现要素:

4.本发明的目的在于提供一种基于大数据的信息智能分析方法,以解决上述背景技术中提出的问题。
5.为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的信息智能分析方法,应用于信息智能分析系统,包括信息处理模块、计算分析模块与控制管理模块,所述信息处理模块与计算分析模块电连接,所述控制管理模块分别与信息处理模块、计算分析模块电连接,所述信息处理模块用于对媒体机构收集到的信息数据进行处理,所述计算分析模块用于对信息数据进行分析计算,所述控制管理模块用于对信息数据进行控制管理。
6.根据上述技术方案,所述信息处理模块包括信息接收模块、识别筛选模块与主题确定模块,所述信息接收模块与识别筛选模块电连接,所述识别筛选模块与主题确定模块电连接,所述信息接收模块用于对媒体机构收集到的信息数据进行接收存储,所述识别筛选模块用于对信息数据进行识别与筛选处理,所述主题确定模块用于完成对媒体机构收集到信息数据的主题内容确定。
7.根据上述技术方案,所述计算分析模块包括统计选择模块、信息分析模块与选择性计算模块,所述统计选择模块与信息分析模块电连接,所述选择性计算模块分别与统计选择模块、信息分析模块电连接,所述统计选择模块用于对媒体机构已发布报道的新闻信息进行统计选择,所述信息分析模块用于对信息数据进行分析处理,所述选择性计算模块用于对媒体机构所要撰写的信息数据可选择性进行计算分析。
8.根据上述技术方案,所述控制管理模块包括排序单元、样本标记模块与撰写整合模块,所述排序单元与样本标记模块电连接,所述撰写整合模块分别与排序单元、样本标记模块电连接,所述排序单元用于对信息数据内容进行相似性排序,所述样本标记模块用于
对被选择的信息数据进行标记,所述撰写整合模块用于对媒体机构所要发布报道的新闻信息进行撰写整合。
9.根据上述技术方案,所述大数据的信息智能分析方法主要包括以下步骤:
10.步骤s1:建立信息数据库,对本媒体机构已发布报道的新闻信息及新闻信息撰写要求进行存储记录;
11.步骤s2:将媒体机构工作人员上传到信息智能分析系统的信息数据进行初步处理,完成信息数据的识别筛选;
12.步骤s3:根据初步处理结果对本媒体机构所要撰写发布报道新闻信息内容的选择性进行分析计算;
13.步骤s4:进一步根据上述分析计算结果对媒体机构上传的信息数据进行初步撰写管理。
14.根据上述技术方案,所述步骤s2进一步包括以下步骤:
15.步骤s21:媒体机构工作人员将收集到准备进行发布报道撰写的信息数据通过信息接收模块上传到信息智能分析系统进行接收并存储后,通过电信号启用识别筛选模块;
16.步骤s22:获取到上述接收存储的信息数据后,识别筛选模块对该信息数据进行识别筛选,将重复的内容滤除后进一步对信息数据进行语义、关键词识别;
17.步骤s23:根据上述对语义、关键词识别结果,对每条信息内容所要表达的总体内容进行提取记录后,进一步对全部信息提取记录结果进行识别进而通过主题确定模块确定本次采集信息所要撰写的主题;
18.步骤s24:根据确定的主题进一步对信息数据进行筛选,根据新闻信息撰写要求及与主题内容无关的信息数据进行滤除筛选后,完成信息数据的初步处理。
19.根据上述技术方案,所述步骤s3进一步包括以下步骤:
20.步骤s31:对该媒体机构已发布报道的新闻信息通过统计选择模块进行统计选择,将其中点击阅读量大于阈值d的新闻信息统计后将其选择存储至系统中;
21.步骤s32:获取到上述存储结果后,信息分析模块对存储结果中的新闻信息进行分析,分别确定其主题后以根据各自主题内容建立信息树模型,其中将每个主题中新闻信息所包含内容的所属撰写结构方式为信息树分枝,完成信息树的构建;
22.步骤s33:完成信息树的构建后,将本次采集信息所要撰写的主题与上述所建立的信息树模型所属主题分别进行匹配,从而通过排序单元将与本次主题匹配性由高至低的顺序将全部信息树进行排序;
23.步骤s34:在对本次所要撰写的主题结构方式进行构建时,将其中所要构建的子结构方式分别与上述主题匹配性由高至低排序完成的信息树进行匹配,得到其中信息树的主题匹配性为z后,进一步将该信息树中与本次所要撰写构建的子结构方式进行匹配,得到该信息树子结构的匹配性为j;
24.步骤s35:获取到上述信息数据后通过选择性计算模块计算得到在撰写本次所要构建的子结构时对该信息树的选择性为x;
25.步骤s36:重复步骤s34与步骤s35完成全部信息树的选择性计算,对选择性计算结果最高的信息树模型通过样本标记模块进行颜色标记。
26.根据上述技术方案,所述步骤s35中对信息树选择性x的计算公式如下:
27.x=kz+j
28.式中,x为信息树的选择性值,k为选择性转换系数,且k为大于零的常数,z为信息树的主题匹配性值,j为信息树子结构的匹配性值。
29.根据上述技术方案,所述步骤s4进一步包括以下步骤:
30.步骤s41:重复步骤s34-步骤s36完成本次所要撰写主题的全部子结构构建的信息树模型选择后,通过电信号启用撰写整合模块;
31.步骤s42:根据上述要撰写主题的全部子结构构建的信息树模型选择结果,撰写整合模块对本次所要撰写的主题进行撰写整合,完成媒体机构所要发布报道的信息处理。
32.与现有技术相比,本发明所达到的有益效果是:本发明,通过设置有信息处理模块、计算分析模块与控制管理模块,通过对无关的信息数据的滤除,可使后续信息数据的分析结果更加准确、科学,同时可减少系统的分析运算力、提高系统的分析处理效率,进一步通过信息树的主题匹配性与信息树子结构的匹配性来计算该对信息树的选择性,可使选择参考的本次撰写的主题所要构建的子结构方式在与本次主题符合的同时与信息树的子结构同样符合,即所要构建的子结构方式更加符合读者的阅读口味;同时可使信息分析处理更加高效准确,有效的减少了人工处理分析所带来的误差。
附图说明
33.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
34.图1是本发明的系统模块组成示意图。
具体实施方式
35.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
36.请参阅图1,本发明提供技术方案:一种基于大数据的信息智能分析方法,应用于信息智能分析系统,包括信息处理模块、计算分析模块与控制管理模块,信息处理模块与计算分析模块电连接,控制管理模块分别与信息处理模块、计算分析模块电连接,信息处理模块用于对媒体机构收集到的信息数据进行处理,计算分析模块用于对信息数据进行分析计算,控制管理模块用于对信息数据进行控制管理。
37.信息处理模块包括信息接收模块、识别筛选模块与主题确定模块,信息接收模块与识别筛选模块电连接,识别筛选模块与主题确定模块电连接,信息接收模块用于对媒体机构收集到的信息数据进行接收存储,识别筛选模块用于对信息数据进行识别与筛选处理,主题确定模块用于完成对媒体机构收集到信息数据的主题内容确定。
38.计算分析模块包括统计选择模块、信息分析模块与选择性计算模块,统计选择模块与信息分析模块电连接,选择性计算模块分别与统计选择模块、信息分析模块电连接,统计选择模块用于对媒体机构已发布报道的新闻信息进行统计选择,信息分析模块用于对信息数据进行分析处理,选择性计算模块用于对媒体机构所要撰写的信息数据可选择性进行
计算分析。
39.控制管理模块包括排序单元、样本标记模块与撰写整合模块,排序单元与样本标记模块电连接,撰写整合模块分别与排序单元、样本标记模块电连接,排序单元用于对信息数据内容进行相似性排序,样本标记模块用于对被选择的信息数据进行标记,撰写整合模块用于对媒体机构所要发布报道的新闻信息进行撰写整合。
40.大数据的信息智能分析方法主要包括以下步骤:
41.步骤s1:建立信息数据库,对本媒体机构已发布报道的新闻信息及新闻信息撰写要求进行存储记录;
42.步骤s2:将媒体机构工作人员上传到信息智能分析系统的信息数据进行初步处理,完成信息数据的识别筛选;
43.步骤s3:根据初步处理结果对本媒体机构所要撰写发布报道新闻信息内容的选择性进行分析计算;
44.步骤s4:进一步根据上述分析计算结果对媒体机构上传的信息数据进行初步撰写管理。
45.步骤s2进一步包括以下步骤:
46.步骤s21:媒体机构工作人员将收集到准备进行发布报道撰写的信息数据通过信息接收模块上传到信息智能分析系统进行接收并存储后,通过电信号启用识别筛选模块;
47.步骤s22:获取到上述接收存储的信息数据后,识别筛选模块对该信息数据进行识别筛选,将重复的内容滤除后进一步对信息数据进行语义、关键词识别;
48.步骤s23:根据上述对语义、关键词识别结果,对每条信息内容所要表达的总体内容进行提取记录后,进一步对全部信息提取记录结果进行识别进而通过主题确定模块确定本次采集信息所要撰写的主题;
49.步骤s24:根据确定的主题进一步对信息数据进行筛选,根据新闻信息撰写要求及与主题内容无关的信息数据进行滤除筛选后,完成信息数据的初步处理;步骤s22中滤除的是重复的数据信息,而步骤s24滤除的是与撰写要求及与主题内容无关的信息数据,通过对无关的信息数据的滤除,可使后续信息数据的分析结果更加准确、科学,同时可减少系统的分析运算力、提高系统的分析处理效率。
50.步骤s3进一步包括以下步骤:
51.步骤s31:对该媒体机构已发布报道的新闻信息通过统计选择模块进行统计选择,将其中点击阅读量大于阈值d的新闻信息统计后将其选择存储至系统中;点击阅读量大于阈值d的新闻信息表明该新闻信息的撰写结构方式更受到读者的欢迎喜爱,故对点击阅读量大于阈值d的新闻信息进行统计,可使后续根据该统计结果的信息处理更加符合读者的阅读口味,使本次信息的撰写更加受到欢迎,进一步提升该媒体机构的受欢迎程度、并提高该媒体机构的收益;
52.步骤s32:获取到上述存储结果后,信息分析模块对存储结果中的新闻信息进行分析,分别确定其主题后以根据各自主题内容建立信息树模型,其中将每个主题中新闻信息所包含内容的所属撰写结构方式为信息树分枝,完成信息树的构建;通过该步骤,可使系统对新闻信息所包含内容的所属撰写结构方式的识别更加直观准确,有效的减少系统的识别分析计算压力,使系统对信息的分析识别处理效果更加准确、科学;
53.步骤s33:完成信息树的构建后,将本次采集信息所要撰写的主题与上述所建立的信息树模型所属主题分别进行匹配,从而通过排序单元将与本次主题匹配性由高至低的顺序将全部信息树进行排序;
54.步骤s34:在对本次所要撰写的主题结构方式进行构建时,将其中所要构建的子结构方式分别与上述主题匹配性由高至低排序完成的信息树进行匹配,得到其中信息树的主题匹配性为z后,进一步将该信息树中与本次所要撰写构建的子结构方式进行匹配,得到该信息树子结构的匹配性为j;
55.步骤s35:获取到上述信息数据后通过选择性计算模块计算得到在撰写本次所要构建的子结构时对该信息树的选择性为x;通过信息树的主题匹配性与信息树子结构的匹配性来计算该对信息树的选择性,可使选择参考的本次撰写的主题所要构建的子结构方式在与本次主题符合的同时与信息树的子结构同样符合,即所要构建的子结构方式更加符合读者的阅读口味;
56.步骤s36:重复步骤s34与步骤s35完成全部信息树的选择性计算,对选择性计算结果最高的信息树模型通过样本标记模块进行颜色标记。
57.步骤s35中对信息树选择性x的计算公式如下:
58.x=kz+j
59.式中,x为信息树的选择性值,k为选择性转换系数,且k为大于零的常数,z为信息树的主题匹配性值,j为信息树子结构的匹配性值;由公式可知,信息树的主题匹配性值及信息树子结构的匹配性值越大,信息树的选择性值越大,即该信息树子结构的结构方式与本次所要构建的子结构越符合。
60.步骤s4进一步包括以下步骤:
61.步骤s41:重复步骤s34-步骤s36完成本次所要撰写主题的全部子结构构建的信息树模型选择后,通过电信号启用撰写整合模块;
62.步骤s42:根据上述要撰写主题的全部子结构构建的信息树模型选择结果,撰写整合模块对本次所要撰写的主题进行撰写整合,完成媒体机构所要发布报道的信息处理;通过信息智能分析系统对采集的信息进行分析处理,可使信息分析处理更加高效准确,有效的减少了人工处理分析所带来的误差。
63.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
64.最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1