本发明涉及电数字数据处理领域,具体涉及一种基于aigc技术的热点资讯生成编辑系统。
背景技术:
1、现在已经开发出了很多资讯编辑系统,经过我们大量的检索与参考,发现现有的资讯编辑系统有如公开号为cn110704603b所公开的系统,这些系统方法一般包括:根据用户检索条件获取最近预设时间段内的多篇资讯新闻,并通过计算得到每篇资讯新闻的一个或多个关键词;根据每篇资讯新闻对应的一个或多个关键词,计算得到每篇资讯新闻对应的资讯向量;对各资讯向量进行聚类计算后得到一个或多个簇,对应最近预设时间段内的一个或多个热点事件,并将各热点事件展现给用户。但是该系统需要使用者主动进行搜索,对使用者具有一定的素质要求,无法直接提供一个可靠的网络信息。
技术实现思路
1、本发明的目的在于,针对所存在的不足,提出了一种基于aigc技术的热点资讯生成编辑系统。
2、本发明采用如下技术方案:
3、一种基于aigc技术的热点资讯生成编辑系统,包括数据检索模块、热度更正模块、排序处理模块、资讯分析模块、资讯存储模块和编辑输出模块;
4、所述数据检索模块用于从各大互联网社区中获取原始信息数据,所述热度更正模块用于对热点的真实热度数据进行更正处理,所述排序处理模块用于对每个热点进行排序处理,所述资讯分析模块基于aigc技术对原始信息进行分析处理得到资讯内容,所述资讯存储模块用于保存资讯内容,所述编辑输出模块用于将资讯内容按照排序进行编辑后输出显示;
5、所述热度更正模块包括行为识别单元、热度计算单元和热度存储单元,所述行为识别单元用于识别对具体信息内容的访问数据,所述热度计算单元用于执行热度值相关的计算任务,所述热度存储单元用于保存热度值数据;
6、所述热度更正模块对热度值进行一次更正和二次更正,所述一次更正指计算出每个资讯词条的热度值,所述二次更正指计算出每个资讯内容的热度值;
7、所述资讯分析模块通过对每个资讯词条的具体信息内容进行分析处理,将一个资讯词条直接转换成一个资讯内容或者将至少两个资讯词条合并成一个资讯内容;
8、所述排序处理模块将资讯内容的热度值信息处理成排序指数,并根据排序指数从高到低对资讯内容进行排序;
9、进一步的,在一次更正时,所述热度计算单元根据下式计算出一个资讯词条的热度值hot:
10、;
11、其中,k1为内容权重系数,k2为访问权重系数,为具体信息内容数量,为有效访问次数;
12、在二次更正时,所述热度计算单元根据下式计算出合并后的资讯内容的热度值:
13、;
14、其中,表示合并的第i个资讯词条的热度值,n为需要合并的资讯词条的数量,为这n个热度值中最大的热度值;
15、对于未合并的资讯词条,所述热度更正模块直接将资讯词条的热度值作为对应的资讯内容的热度值;
16、进一步的,所述排序处理模块对资讯内容进行排序的过程包括如下步骤:
17、s31、根据资讯内容的热度值从高到低对资讯内容进行排序;
18、s32、统计出前m的资讯内容中分别属于各社区平台的数量;
19、s33、根据下式计算出每个社区平台的补偿系数λ(cp):
20、;
21、其中,cp用于表示社区平台,m(cp)为对应社区平台在步骤s32中统计得到的数量,m为内容输出数量;
22、s34、根据下式计算出前2m的每个资讯内容的排序指数p:
23、;
24、其中,u为资讯内容所属的社区平台的数量,cp’为资讯内容所属的社区平台;
25、s35、根据资讯内容的排序指数从高到低对前2m个资讯内容进行重新排序;
26、进一步的,所述资讯分析模块包括关键词提取单元、对比分析单元和内容生成单元,所述关键词提取单元用于提取每个资讯词条下所有具体信息内容的关键词,所述对比分析单元用于将不同资讯词条的关键词进行对比,确认不同的资讯词条是否对应同一个实际内容,所述内容生成单元基于关键词生成新的资讯内容;
27、进一步的,所述对比分析单元包括对比寄存器、对比处理器和计数处理器,所述对比寄存器包括两个区域,一个为目标区域,一个为对照区域,所述对比分析单元获取两个不同资讯词条的关键词,将数量少的关键词存储在目标区域中,将数量多的关键词存储在对照区域中,所述对比处理器从所述目标区域中获取一个关键词与对照区域中的关键词比较,若所述对照区域中存在一致的关键词,则所述计数处理器进行累计计数,当所述对比处理器获取完所述目标区域中的所有关键词后,若计数处理器中的累计数值超过所述目标区域中的关键词数量的一半,则判定这两个资讯词条对应同一个实际内容,然后将对比寄存器中的关键词清空,将计数处理器中的计数值清零。
28、本发明所取得的有益效果是:
29、本系统通过热度更正模块对热点信息进行一次更正,排除了干扰,使热度值更能反映真实的情况,热度更正模块还进行二次更正,避免了一个事件形成多个热点资讯造成霸屏的情况,提供更多不同事件的信息内容,本系统从不同社区平台中获取信息内容并进行重排序,使得较小平台的信息也能够被展现,避免被单一社区的信息造成信息茧房的效果。
30、为使能更进一步了解本发明的特征及技术内容,请参阅以下有关本发明的详细说明与附图,然而所提供的附图仅用于提供参考与说明,并非用来对本发明加以限制。
1.一种基于aigc技术的热点资讯生成编辑系统,其特征在于,包括数据检索模块、热度更正模块、排序处理模块、资讯分析模块、资讯存储模块和编辑输出模块;
2.如权利要求1所述的一种基于aigc技术的热点资讯生成编辑系统,其特征在于,在一次更正时,所述热度计算单元根据下式计算出一个资讯词条的热度值hot:
3.如权利要求2所述的一种基于aigc技术的热点资讯生成编辑系统,其特征在于,所述排序处理模块对资讯内容进行排序的过程包括如下步骤:
4.如权利要求3所述的一种基于aigc技术的热点资讯生成编辑系统,其特征在于,所述资讯分析模块包括关键词提取单元、对比分析单元和内容生成单元,所述关键词提取单元用于提取每个资讯词条下所有具体信息内容的关键词,所述对比分析单元用于将不同资讯词条的关键词进行对比,确认不同的资讯词条是否对应同一个实际内容,所述内容生成单元基于关键词生成新的资讯内容。
5.如权利要求4所述的一种基于aigc技术的热点资讯生成编辑系统,其特征在于,所述对比分析单元包括对比寄存器、对比处理器和计数处理器,所述对比寄存器包括两个区域,一个为目标区域,一个为对照区域,所述对比分析单元获取两个不同资讯词条的关键词,将数量少的关键词存储在目标区域中,将数量多的关键词存储在对照区域中,所述对比处理器从所述目标区域中获取一个关键词与对照区域中的关键词比较,若所述对照区域中存在一致的关键词,则所述计数处理器进行累计计数,当所述对比处理器获取完所述目标区域中的所有关键词后,若计数处理器中的累计数值超过所述目标区域中的关键词数量的一半,则判定这两个资讯词条对应同一个实际内容,然后将对比寄存器中的关键词清空,将计数处理器中的计数值清零。