一种基于文本挖掘与深度学习模型的农产品期货价格预测方法及系统

文档序号:32837873发布日期:2023-01-06 19:47阅读:来源:国知局

技术特征:
1.一种基于文本挖掘与深度学习模型的农产品期货价格预测方法,其特征在于,包括以下步骤:步骤1:数据预处理,对价格序列进行数据清洗和归一化处理,对文本数据集进行分词和停用词去除,利用词嵌入技术word2vec和tf-idf将新闻标题表示成低维的稠密矩阵;步骤2:特征提取,通过bilstm神经网络的时序记忆能力学习历史交易数据的动态变化规律,将价格序列映射到高维空间进行抽象表示,输出价格特征;基于新闻文本的表示向量矩阵,使用textcnn进行融合语义信息的文本特征提取;基于完成预处理的新闻文本使用snownlp库提取情感特征;步骤3:特征融合,搭建深度神经网络特征融合层,拼接同一时间尺度下的价格特征、文本特征以及情感特征;步骤4:预测,通过全连接层的激活函数relu计算农产品期货价格的预测结果并输出。2.根据权利要求1所述的一种基于文本挖掘与深度学习模型的农产品期货价格预测方法,其特征在于:所述步骤1的数据采集与数据预处理包括以下子步骤:步骤1.1:制定采集规则,选定数据采集的目标网站,确定检索关键词、采集的数据量以及数据的时间区间;步骤1.2:网络爬虫,根据制定的数据采集规则,通过网络爬虫技术爬取农产品期货交易历史数据以及新闻标题;步骤1.3:数据清洗,对采集的农产品期货收盘价数据和新闻标题分别进行缺失值处理、无关标题和异常内容剔除;步骤1.4:归一化处理,采用min-max方法对农产品期货的收盘价进行归一化处理,计算公式如下:其中,p为期货原始收盘价,p

为归一化后的收盘价。步骤1.5:新闻文本分词和停用词去除,使用中文停用词表、哈工大停用词表、百度停用词表和四川大学机器智能实验室停用词库,采用python的jieba分词器在分词过程中直接去除停用词;步骤1.6:词向量训练,采用tf-idf叠加word2vec模型进行词向量训练,能够考虑不同词语在整体文本中的重要性的同时增强新闻标题短文本词向量的表达能力,最终获得低维且稠密的文本向量。3.根据权利要求2所述的一种基于文本挖掘与深度学习模型的农产品期货价格预测方法,其特征在于:所述步骤2的特征提取包括以下子步骤:步骤2.1:通过滑动窗口法沿时间戳取固定窗口大小的价格序列和文本向量作为样本;步骤2.2:使用bilstm提取农产品期货价格特征,通过滑动窗口法沿时间戳取固定窗口大小的价格序列作为样本输入神经网络中的bilstm层,同时学习样本窗口内价格序列历史数据和未来数据的波动信息;步骤2.3:使用textcnn建立文本特征,利用网络结构中多个不同尺寸的卷积核深度学习样本窗口中的文本关联特征,提取向量矩阵中的关键信息特征;步骤2.4:使用snownlp提取新闻情感特征,对所使用的新闻标题数据集进行情感标注,
引入多类常用中文情感词汇库对snownlp本身的语料库进行扩展;基于新建立的语料库使用snownlp的模型进行重新训练,得到每个新闻标题的新闻情感特征。4.根据权利要求3所述的一种基于文本挖掘与深度学习模型的农产品期货价格预测方法,其特征在于:所述步骤3的特征融合包括以下子步骤:步骤3.1:使用concatenate函数拼接同一时间尺度下的价格特征、文本特征和情感特征,拼接后的特征序列如下:其中,p
i
为价格序列,d
i
为文本向量序列,s
i
为情感特征序列。5.一种应用权利要求1-4任一项所述的一种基于文本挖掘与深度学习模型的农产品期货价格预测方法的系统,其特征在于:包括以下模块:数据预处理模块:对价格序列进行数据清洗和归一化处理,对文本数据集进行分词和停用词去除,利用词嵌入技术word2vec和tf-idf将新闻标题表示成低维的稠密矩阵;特征提取模块:通过bilstm神经网络的时序记忆能力学习历史交易数据的动态变化规律,将价格序列映射到高维空间进行抽象表示,输出价格特征;基于新闻文本的表示向量矩阵,使用textcnn进行融合语义信息的文本特征提取;基于完成预处理的新闻文本使用snownlp库提取情感特征;特征融合模块:搭建深度神经网络特征融合层,拼接同一时间尺度下的价格特征、文本特征以及情感特征;预测模块:通过全连接层的激活函数relu计算农产品期货价格的预测结果并输出。6.一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,其特征在于,所述处理器执行计算机程序时实现权利要求1至4任一项所述的基于文本挖掘与深度学习模型的农产品期货价格预测方法。7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的基于文本挖掘与深度学习模型的农产品期货价格预测方法。

技术总结
本发明公开了一种基于文本挖掘与深度学习模型的农产品期货价格预测方法及系统,该方法包括:采集农产品期货历史交易数据和农产品期货新闻文本数据并进行数据预处理;选取T天为窗口滑动划分数据集,将得到的数据集作为多特征数据样本;使用双向长短期记忆神经网络(BiLSTM)提取价格特征;使用卷积神经网络(textCNN)提取文本特征;使用snowNLP提取新闻情感特征;搭建深度神经网络融合三种特征对提前一步的农产品期货收盘价进行预测。本发明考虑影响农产品期货价格波动的市场和非市场因素,基于文本挖掘与深度学习模型对农产品期货价格趋势进行预测,该方法能够挖掘新闻文本和价格序列的深层特征,且具备更高的预测精度。且具备更高的预测精度。且具备更高的预测精度。


技术研发人员:张大斌 曾芷媚 余泽汇 黄均杰 吕兴 张学竞 林锐斌
受保护的技术使用者:华南农业大学
技术研发日:2022.10.31
技术公布日:2023/1/5
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1