一种基于深度学习的新闻数据处理系统及其处理方法与流程

文档序号：19376425发布日期：2019-12-10 23:55阅读：来源：国知局

技术特征：

1.一种基于深度学习的新闻数据处理方法，其特征在于，包括：

获取训练样本新闻的第一预设数量的待推送新闻关键词；

获取用户偏好新闻的第一预设数量的用户偏好新闻关键词；

向用户推送待推送样本新闻，并获取用户反馈的用户满意度评分；

基于待推送新闻关键词、用户偏好新闻关键词和用户反馈的满意度评分得到训练样本；

建立bp神经网络模型，根据待推送新闻关键词、用户偏好新闻关键词、用户满意度评分对bp神经网络模型进行bp神经网络训练；

获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词，输入bp神经网络模型，得到用户满意度评分，并根据用户满意度评分确定是否向待推送用户推送待推送新闻。

2.如权利要求1所述的一种基于深度学习的新闻数据处理方法，其特征在于，获取训练样本新闻的第一预设数量的待推送新闻关键词，包括：获取训练样本新闻的新闻关键词，判断训练样本新闻的新闻关键词的数量，若训练样本新闻的新闻关键词的数量多于第一预设数量，则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词；若训练样本新闻的新闻关键词的数量少于第一预设数量，则缺少的新闻关键词以预设关键词作为待推送新闻关键词。

3.如权利要求1所述的一种基于深度学习的新闻数据处理方法，其特征在于，获取用户偏好新闻的第一预设数量的用户偏好新闻关键词，包括：获取用户偏好新闻的新闻关键词，判断用户偏好新闻的新闻关键词的数量，若用户偏好新闻的新闻关键词的数量多于第一预设数量，则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词；若用户偏好新闻的新闻关键词的数量少于第一预设数量，则缺少的新闻关键词以预设关键词作为用户偏好新闻关键词。

4.如权利要求1所述的一种基于深度学习的新闻数据处理方法，其特征在于，获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词，包括：获取待推送新闻的新闻关键词，判断待推送新闻的新闻关键词的数量，若待推送新闻的新闻关键词的数量多于第一预设数量，则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词；若训练样本新闻的新闻关键词的数量少于第一预设数量，则缺少的新闻关键词以预设关键词作为待推送新闻关键词；获取用户偏好新闻的新闻关键词，判断用户偏好新闻的新闻关键词的数量，若用户偏好新闻的新闻关键词的数量多于第一预设数量，则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词；若用户偏好新闻的新闻关键词的数量少于第一预设数量，则缺少的新闻关键词以预设关键词作为用户偏好新闻关键词。

5.如权利要求1所述的一种基于深度学习的新闻数据处理方法，其特征在于，所述方法还包括：

建立参照词典；

在获取训练样本新闻的第一预设数量的待推送新闻关键词时，将待推送新闻关键词作为参照关键词，并录入参照词典中；

在获取用户偏好新闻的第一预设数量的用户偏好新闻关键词时，将用户偏好新闻关键词作为参照关键词，并录入参照词典中；

获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词包括：获取待推送新闻中的字符，并将待推送新闻中的字符与参照词典中的参照关键词进行比对，若比对成功，则将比对成功的参照关键词作为待推送新闻的预备关键词；将待推送新闻的预备关键词与待推送新闻中的字符进行比对，判断预备关键词在待推送新闻出现的次数；获取预备关键词出现的次数最多的前第一预设数量个预备关键词作为待推送新闻关键词。

6.如权利要求1所述的一种基于深度学习的新闻数据处理方法，其特征在于，所述方法还包括：

建立参照词典；

获取训练样本新闻的第一预设数量的待推送新闻关键词时，将待推送新闻关键词作为预备参照关键词，获取用户偏好新闻的第一预设数量的用户偏好新闻关键词时，将用户偏好新闻关键词作为预备参照关键词；

判断参照词典中是否存在与该预备参照关键词一致的参照关键词，若存在与该预备参照关键词一致的参照关键词，则取消该预备参照关键词，若不存在与该预备参照关键词一致的参照关键词，则判断参照词典中是否存在与该预备参照关键词一致的预备参照关键词，若存在与该预备参照关键词一致的预备参照关键词，则增加参照词典中该参照关键词的权重，若不存在与该预备参照关键词一致的预备参照关键词，则在参照词典中增加该预备参照关键词，并初始化该预备参照关键词的权重；判断参照词典中预备参照关键词的权重是否大于预设权重，若大于预设权重，则将该预备参照关键词置为参照关键词

获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词包括：获取待推送新闻中的字符，并将待推送新闻中的字符与参照词典中的参照关键词进行比对，若比对成功，则将比对成功的参照关键词作为待推送新闻的预备关键词；将待推送新闻的预备关键词与待推送新闻中的字符进行比对，判断预备关键词在待推送新闻出现的次数fi、在待推送新闻的标题中出现的次数gi，以及预备关键词在待推送新闻中各段落出现的次数eij；计算通过公式1计算各预备关键词的权重di；

公式1中，di表示预备关键词i的权重，fi表示预备关键词i在待推送新闻出现的次数，gi表示预备关键词i在待推送新闻的标题中出现的次数gi，eij表示预备关键词i在待推送新闻中的第j段出现的次数，n表示待推送新闻的总段落数；

按各预备关键词的权重di的从大到小排序，以排在前第一预设数量的预备关键词作为待推送新闻关键词。

7.一种基于深度学习的新闻数据处理系统，其特征在于，包括：

训练样本获取模块，用于获取训练样本新闻的第一预设数量的待推送新闻关键词；获取用户偏好新闻的第一预设数量的用户偏好新闻关键词；向用户推送待推送样本新闻，并获取用户反馈的用户满意度评分；基于待推送新闻关键词、用户偏好新闻关键词和用户反馈的满意度评分得到训练样本；

训练模块：建立bp神经网络模型，根据待推送新闻关键词、用户偏好新闻关键词、用户满意度评分对bp神经网络模型进行bp神经网络训练；

新闻推送模块：获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词，输入bp神经网络模型，得到用户满意度评分，并根据用户满意度评分确定是否向待推送用户推送待推送新闻。

8.如权利要求7所述的一种基于深度学习的新闻数据处理系统，其特征在于，获取训练样本新闻的第一预设数量的待推送新闻关键词，包括：获取训练样本新闻的新闻关键词，判断训练样本新闻的新闻关键词的数量，若训练样本新闻的新闻关键词的数量多于第一预设数量，则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词；若训练样本新闻的新闻关键词的数量少于第一预设数量，则缺少的新闻关键词以预设关键词作为待推送新闻关键词。

9.如权利要求7所述的一种基于深度学习的新闻数据处理方法，其特征在于，获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词，包括：获取待推送新闻的新闻关键词，判断待推送新闻的新闻关键词的数量，若待推送新闻的新闻关键词的数量多于第一预设数量，则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词；若训练样本新闻的新闻关键词的数量少于第一预设数量，则缺少的新闻关键词以预设关键词作为待推送新闻关键词；获取用户偏好新闻的新闻关键词，判断用户偏好新闻的新闻关键词的数量，若用户偏好新闻的新闻关键词的数量多于第一预设数量，则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词；若用户偏好新闻的新闻关键词的数量少于第一预设数量，则缺少的新闻关键词以预设关键词作为用户偏好新闻关键词。

10.如权利要求7所述的一种基于深度学习的新闻数据处理方法，其特征在于，所述系统还包括：

参照词典建立模块，用于建立参照词典；在获取训练样本新闻的第一预设数量的待推送新闻关键词时，将待推送新闻关键词作为参照关键词，并录入参照词典中；在获取用户偏好新闻的第一预设数量的用户偏好新闻关键词时，将用户偏好新闻关键词作为参照关键词，并录入参照词典中；

获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词，包括：获取待推送新闻中的字符，并将待推送新闻中的字符与参照词典中的参照关键词进行比对，若比对成功，则将比对成功的参照关键词作为待推送新闻的预备关键词；将待推送新闻的预备关键词与待推送新闻中的字符进行比对，判断预备关键词在待推送新闻出现的次数；获取预备关键词出现的次数最多的前第一预设数量个预备关键词作为待推送新闻关键词。

技术总结
为了解决现有技术中的问题，本公开提供了一种基于深度学习的新闻数据处理系统及其处理方法，通过深度学习，向用户推送新闻，提高新闻推送的准确率，提高用户体验。包括获取训练样本新闻的第一预设数量的待推送新闻关键词、用户偏好新闻的第一预设数量的用户偏好新闻关键词、用户反馈的用户满意度评分；训练BP神经网络模型；并根据BP神经网络模型向待推送用户推送待推送新闻；本公开基于深度学习，自动处理待推送新闻，将待推送新闻推送给所需的用户，实现新闻数据的有效利用，提高新闻推送效率，提高用户体验。

技术研发人员：郑骥;祁海峰
受保护的技术使用者：北京人民在线网络有限公司
技术研发日：2019.09.04
技术公布日：2019.12.10

完整全部详细技术资料下载

当前第2页1 2