一种基于人工智能的互联网信息智能决策系统的制作方法

文档序号：40517702发布日期：2024-12-31 13:27阅读：26来源：国知局

本发明涉及数据处理领域，具体是一种基于人工智能的互联网信息智能决策系统。

背景技术：

1、随着互联网的迅猛发展，信息量呈现爆炸式增长，如何从海量信息中快速、准确地提取有价值的信息，辅助决策，成为了一个重要的研究课题和实际需求，传统的信息处理方法已经无法满足当前复杂多变的需求，因而基于人工智能的互联网信息智能决策系统应运而生；

2、如何获得互联网信息数据切分的词语的活跃值，根据所获得的互联网信息数据切分的词语的活跃值进行智能决策，从而提高互联网信息数据推送的可靠性，是我们需要解决的问题，为此，现提供一种基于人工智能的互联网信息智能决策系统。

技术实现思路

1、为了解决上述技术问题，本发明的目的在于提供一种基于人工智能的互联网信息智能决策系统。

2、本发明的目的可以通过以下技术方案实现：一种基于人工智能的互联网信息智能决策系统，包括决策中心，所述决策中心通信连接有数据采集模块、数据预处理模块、数据处理模块以及智能决策模块；

3、所述数据采集模块用于对待推送的互联网信息数据进行采集；

4、所述数据预处理模块用于对所采集的待推送的互联网信息数据进行预处理，获得互联网信息数据切分的词语；

5、所述数据处理模块用于对所获得的互联网信息数据切分的词语进行处理，获得互联网信息数据切分的词语的活跃值；

6、所述智能决策模块用于根据所获得的互联网信息数据切分的词语的活跃值进行智能决策。

7、进一步的，所述数据采集模块对待推送的互联网信息数据进行采集的过程包括：

8、所述数据采集模块由若干个互联网信息数据采集终端构成，所述互联网信息数据采集终端用于采集待推送给用户的互联网信息数据；

9、对每个互联网信息数据采集终端进行配置，并生成对应的配置通道，通过所生成的配置通道，链接对应的服务器，互联网信息数据采集终端通过配置通道，获取对应服务器内的待推送的互联网信息数据。

10、进一步的，所述数据预处理模块对所采集的待推送的互联网信息数据进行预处理的过程包括：

11、所述预处理模块中设置有词语数据库，所述词语数据库中存储有若干个词语；

12、获取词语数据库中存储的最长词语的长度，将所获取的词语数据库中存储的最长词语的长度记为l；

13、通过人工智能技术对互联网信息数据进行一级分词预处理，获得一级分词预处理的结果，所述一级分词预处理的结果包括若干个词语；

14、通过人工智能技术对互联网信息数据进行二级分词预处理，获得二级分词预处理的结果，所述二级分词预处理的结果包括若干个词语；

15、将一级分词预处理获得的词语数量与二级分词预处理获得的词语数量进行比较，若比较结果相同，则将一级分词预处理获得的词语作为互联网信息数据切分的词语；

16、若比较结果不同，则将一级分词预处理获得的词语和二级分词预处理获得的词语进行混合，将混合后的词语作为互联网信息数据切分的词语。

17、进一步的，通过人工智能技术对互联网信息数据进行一级分词预处理的过程包括：

18、设定一级最大匹配长度，将一级最大单词长度设定为l；

19、从互联网信息数据的第一个字符开始，获取前l个字符，将所获取的l个字符作为待匹配字符片段；

20、获取前l个字符组成的待匹配字符片段切分的词语；

21、获取第(l+1)至2l个字符组成的字符片段，将所获取的第(l+1)至2l个字符组成的字符片段作为待匹配字符片段，获取第(l+1)至2l个字符组成的待匹配字符片段切分的词语，获取第(2l+1)至3l个字符组成的字符片段，将所获取的第(2l+1)至3l个字符组成的字符片段作为待匹配字符片段，获取第(2l+1)至3l个字符组成的待匹配字符片段切分的词语，以此类推，获取互联网信息数据剩余字符组成的字符片段切分的词语。

22、进一步的，获取前l个字符组成的待匹配字符片段切分的词语的过程包括：

23、将前l个字符组成的待匹配字符片段与词语数据库中存储的词语进行匹配，若词语数据库中存在与待匹配字符片段相同的词语，则将待匹配字符片段作为一个词语从互联网信息数据中切分出来，若词语数据库中不存在与待匹配字符片段相同的词语，则将待匹配字符片段的前(l-1)个字符与词语数据库中存储的词语进行匹配；

24、若词语数据库中存在与待匹配字符片段的前(l-1)个字符相同的词语，则将待匹配字符片段的前(l-1)个字符作为一个词语从互联网信息数据中切分出来，并将切分后剩余的待匹配字符片段与词语数据库中存储的词语进行匹配，若词语数据库中存在与切分后剩余的待匹配字符片段相同的词语，则将切分后剩余的待匹配字符片段作为一个词语从互联网信息数据中切分出来，若词语数据库中不存在与待匹配字符片段相同的词语，则保留切分后剩余的待匹配字符片段；

25、若词语数据库中不存在与待匹配字符片段的前(l-1)个字符相同的词语，则将待匹配字符片段中剩余未匹配的字符与词语数据库中存储的词语进行匹配；

26、若词语数据库中存在与待匹配字符片段中剩余未匹配的字符相同的词语，则将待匹配字符片段中剩余未匹配的字符作为一个词语从互联网信息数据中切分出来，若词语数据库中不存在与待匹配字符片段中剩余未匹配的字符相同的词语，则保留待匹配字符片段中剩余未匹配的字符，并将待匹配字符片段的前(l-2)个字符与词语数据库中存储的词语进行匹配，以此类推，……，直至将待匹配字符片段的第一个字符与词语数据库中存储的词语进行匹配，或词语数据库中存在与待匹配字符片段的前l个或前(l-1)个或前(l-2)个或前(l-3)个或前(l-4)个或……或前两个字符相同的词语，获得前l个字符组成的待匹配字符片段切分的词语。

27、进一步的，通过人工智能技术对互联网信息数据进行二级分词预处理的过程包括：

28、设定二级最大匹配长度，将二级最大单词长度设定为l，即二级最大单词长度和词语数据库中存储的最长词语的长度相同；

29、从互联网信息数据的最后一个字符开始，获取后l个字符，将所获取的后l个字符作为待匹配字符片段，获取后l个字符组成的待匹配字符片段切分的词语；

30、获取后(l+1)至2l个字符组成的字符片段，将所获取的后(l+1)至2l个字符组成的字符片段作为待匹配字符片段，获取后(l+1)至2l个字符组成的待匹配字符片段切分的词语，以此类推，获取互联网信息数据剩余字符组成的字符片段切分的词语。

31、进一步的，所述数据处理模块对所获得的互联网信息数据切分的词语进行处理的过程包括：

32、获取互联网信息数据切分的词语的出现频次，根据所获取的互联网信息数据切分的词语的出现频次获得互联网信息数据切分的词语的活跃值；

33、对所获得的互联网信息数据切分的词语的活跃值从大到小进行排序，获取前k个活跃值对应的互联网信息数据切分的词语，k为不为零的正偶数，将所获取的前k个活跃值对应的互联网信息数据切分的词语记为参考词语。

34、进一步的，所述智能决策模块根据所获得的互联网信息数据切分的词语的活跃值进行智能决策的过程包括：

35、获取用户正在浏览的互联网信息数据，并获取用户正在浏览的互联网信息数据切分的词语的活跃值，对所获取的用户正在浏览的互联网信息数据切分的词语的活跃值从大到小进行排序，获取前k个活跃值对应的用户正在浏览的互联网信息数据切分的词语，将所获取的前k个活跃值对应的用户正在浏览的互联网信息数据切分的词语记为标准词语；

36、将所获取的标准词语与参考词语进行比较，若存在k/2及以上个参考词语与标准词语相同，则将待推送的互联网信息数据推送给用户，若不存在k/2及以上个参考词语与标准词语相同，则禁止将待推送的互联网信息数据推送给用户。

37、与现有技术相比，本发明的有益效果是：对待推送的互联网信息数据进行采集，对所采集的待推送的互联网信息数据进行预处理，获得互联网信息数据切分的词语，对所获得的互联网信息数据切分的词语进行处理，获得互联网信息数据切分的词语的活跃值，根据所获得的互联网信息数据切分的词语的活跃值进行智能决策，根据用户的兴趣进行推送，从而提高了互联网信息数据推送的可靠性。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吕莹,吕锦凯
技术所有人：河北国瑞工业互联网科技有限公司
我是此专利的发明人

上一篇：一种自动化甘蔗种平放种植机的制作方法
上一篇：一种轻质抹灰石膏抹平成型结构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。