本发明涉及数据分析技术领域,特别是涉及一种股票波动预测方法及装置。
背景技术:
股票市场是金融市场的重要组成部分,股票市场的波动预测高度依赖各种数据源的数据。
现有的股票波动预测方法依赖于股票历史定量数据,例如成交价格,换手率等数据。仅考虑股票历史定量数据过于片面,不能完全捕捉股票波动的趋势。举例来讲,与市场相关的社交网络帖子可能会改变投资者的观念,进而影响股价。而现有的股票波动预测方法并未考虑这些因素,可见,现有的股票波动预测方法不能准确预测股票波动。
技术实现要素:
本发明实施例的目的在于提供一种股票波动预测方法及装置,以实现提高股票波动预测结果。具体技术方案如下:
为实现上述目的,本发明实施例提供了一种股票波动预测方法,所述方法包括:
获取待预测的目标股票的多源历史数据,以及与所述目标股票相关的参考股票的多源历史数据;其中,股票的多源历史数据包括:在预测时间点之前预设数量个单位时间的每个单位时间内与股票相关的股市量化数据,新闻标题数据以及网络评价数据;
从所述多源历史数据中提取特征数据;
基于所述参考股票的多源历史数据的特征数据,对所述目标股票的多源历史数据的特征数据进行修正,得到所述目标股票的修正数据;
将所述修正数据输入所述预测模型,得到所述目标股票的波动预测结果,所述预测模型是根据样本股票的多源历史数据的特征数据,以及所述样本股票已知的波动数据训练得到的。
可选的,所述特征数据包括第一特征数据,第二特征数据和第三特征数据;所述从所述多源历史数据数据中提取特征数据的步骤,包括:
将所述股市量化数据标准化,得到第一特征数据;
对所述新闻标题数据进行分词,并将分词得到的词语转换为第一词语向量,得到第二特征数据;
对所述网络评价数据进行分词,并将分词后的词语转换为第二词语向量,从所述第二词语向量中提取情感数据,得到第三特征数据,所述情感数据包括积极情感数据和消极情感数据。
可选的,所述基于所述参考股票的多源历史数据的特征数据,对所述目标股票的多源历史数据的特征数据进行修正,得到所述目标股票的修正数据的步骤,包括:
将所述目标股票的多源历史数据的特征数据以及所述参考股票的多源历史数据的特征数据输入注意力网络中,得到所述目标股票与各个参考股票的相似度;
基于所述相似度,确定各个参考股票的加权权重;
基于所述加权权重,对所述目标股票的特征数据进行加权求和,并根据加权求和结果对所述目标股票的特征数据进行修正,得到所述目标股票的修正数据。
可选的,所述预测模型包括因子分解机模型和深度神经网络模型,按照如下步骤训练所述预测模型:
获取预设的因子分解机模型和深度神经网络模型;
将所述样本股票的多源历史数据的特征数据分别输入所述因子分解机模型和深度神经网络模型,得到所述因子分解机模型的第一输出结果和所述深度神经网络模型的第二输出结果;
聚合所述第一输出结果和所述第二输出结果,得到所述样本股票的波动预测结果;
将所述波动预测结果,以及所述样本股票已知的波动数据代入预先设置的损失函数,确定损失值;
基于所述损失值判断所述预测模型是否收敛,若否,则调整所述因子分解机模型和所述深度神经网络模型中的参数值,并返回将所述样本股票的多源历史数据的特征数据分别输入所述因子分解机模型和深度神经网络模型的步骤;
若是,则将当前的预测模型确定为训练完成的预测模型。
为实现上述目的,本发明示例还提供了一种股票波动预测装置,所述装置包括:
获取模块,用于获取待预测的目标股票的多源历史数据,以及与所述目标股票相关的参考股票的多源历史数据;其中,股票的多源历史数据包括:在预测时间点之前预设数量个单位时间的每个单位时间内与股票相关的股市量化数据,新闻标题数据以及网络评价数据;
提取模块,用于从所述多源历史数据中提取特征数据;
修正模块,用于基于所述参考股票的多源历史数据的特征数据,对所述目标股票的多源历史数据的特征数据进行修正,得到所述目标股票的修正数据;
预测模块,用于将所述修正数据输入所述预测模型,得到所述目标股票的波动预测结果,所述预测模型是根据样本股票的多源历史数据的特征数据,以及所述样本股票已知的波动数据训练得到的。
可选的,所述特征数据包括第一特征数据,第二特征数据和第三特征数据;所述提取装置,具体用于:
将所述股市量化数据标准化,得到第一特征数据;
对所述新闻标题数据进行分词,并将分词得到的词语转换为第一词语向量,得到第二特征数据;
对所述网络评价数据进行分词,并将分词后的词语转换为第二词语向量,从所述第二词语向量中提取情感数据,得到第三特征数据,所述情感数据包括积极情感数据和消极情感数据。
可选的,所述修正模块,具体用于:
将所述目标股票的多源历史数据的特征数据以及所述参考股票的多源历史数据的特征数据输入注意力网络中,得到所述目标股票与各个参考股票的相似度;
基于所述相似度,确定各个参考股票的加权权重;
基于所述加权权重,对所述目标股票的特征数据进行加权求和,并根据加权求和结果对所述目标股票的特征数据进行修正,得到所述目标股票的修正数据。
可选的,所述预测模型包括因子分解机模型和深度神经网络模型,所述装置还包括:训练模块,所述训练模块用于:
获取预设的因子分解机模型和深度神经网络模型;
将所述样本股票的多源历史数据的特征数据分别输入所述因子分解机模型和深度神经网络模型,得到所述因子分解机模型的第一输出结果和所述深度神经网络模型的第二输出结果;
聚合所述第一输出结果和所述第二输出结果,得到所述样本股票的波动预测结果;
将所述波动预测结果,以及所述样本股票已知的波动数据代入预先设置的损失函数,确定损失值;
基于所述损失值判断所述预测模型是否收敛,若否,则调整所述因子分解机模型和所述深度神经网络模型中的参数值,并返回将所述样本股票的多源历史数据的特征数据分别输入所述因子分解机模型和深度神经网络模型的步骤;
若是,则将当前的预测模型确定为训练完成的预测模型。
为了实现上述目的,本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一股票波动预测方法步骤。
为了实现上述目的,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法步骤。
采用本发明实施例提供的股票波动预测方法,获取待预测的目标股票的多源历史数据,以及与目标股票相关的参考股票的多源历史数据;其中,股票的多源历史数据包括:在预测时间点之前预设数量个单位时间的每个单位时间内与股票相关的股市量化数据,新闻标题数据以及网络评价数据;从多源历史数据中提取特征数据;基于参考股票的多源历史数据的特征数据,对目标股票的多源历史数据的特征数据进行修正,得到目标股票的修正数据;将修正数据输入预测模型,得到目标股票的波动预测结果,预测模型是根据样本股票的多源历史数据的特征数据,以及样本股票已知的波动数据训练得到的。可见,综合考虑了多个数据源的历史数据,包括股市量化数据,新闻标题数据以及网络评价数据,相比于现有的仅考虑股票历史定量数据的股票预测方案,能够更准确的捕捉股票波动的趋势,此外,使用参考股票的特征数据对目标股票的特征数据进行修正,即考虑了目标股票与参考股票之间的内在联系,能够进一步提高股票波动预测结果。
当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的股票波动预测方法的一种流程示意图;
图2为本发明实施例提供的股票波动预测方法的一种部分流程示意图;
图3为本发明实施例提供的训练预测模型的一种流程示意图;
图4为本发明实施例提供的股票波动预测方法的一种示意图;
图5为本发明实施例提供的股票波动预测装置的一种结构示意图;
图6为本发明实施例提供的电子设备的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有的股票波动预测方法无法准确预测股票波动的技术问题,本发明实施例提供了一种股票波动预测方法、装置、电子设备及计算机可读存储介质。
参见图1,图1为本发明实施例提供的股票预测方法的一种流程示意图,方法包括以下步骤:
s101:获取待预测的目标股票的多源历史数据,以及与目标股票相关的参考股票的多源历史数据;其中,股票的多源历史数据包括:在预测时间点之前预设数量个单位时间的每个单位时间内与股票相关的股市量化数据,新闻标题数据以及网络评价数据。
本发明实施例中,待预测的股票定义为目标股票,与目标股票相关的股票定义为参考股票,参考股票可以为多个。
其中,参考股票可以根据实际情况进行确定,例如若目标股票是针对品牌a的股票,所确定的参考股票可以是与品牌a旗下的产品相关的股票。上述仅作为示例,本发明实施例对如何确定目标股票的参考股票不做具体限定。
为了对目标股票的波动情况进行预测,可以获取目标股票的多源历史数据,以及参考股票的多源历史数据。其中,多源历史数据表示来自多个数据源的数据。
具体的,多源历史数据可以包括:在预测时间点之前预设数量个单位时间的每个单位时间内与股票相关的股市量化数据,新闻标题数据以及网络评价数据。
其中,单位时间可以根据实际情况进行设定,例如一天为一个单位时间。为了便于说明,下文均以一天为一个单位时间进行说明。
股市量化数据可以包括开盘价、收盘价、最高价、最低价以及换手率等,是数值类数据。而新闻标题数据和网络评价数据是文本类数据,其中,网络评价数据可以是网络帖子中与股票相关的评价等。
作为一个示例,若目标股票为a股票,相应的参考股票包括a股票,b股票和c股票,单位时间为一天,预设数量为10,则可以获取在预测时间点之前的10天中每一天与a股票相关的股市量化数据,新闻标题数据以及网络评价数据,作为a股票的多源历史数据;此外,分别获取在预测时间点之前的10天中每一天与a股票,b股票和c股票相关的股市量化数据,新闻标题数据以及网络评价数据,分别作为参考股票中a股票,b股票和c股票的多源历史数据。
s102:从多源历史数据数据中提取特征数据。
本发明实施例中,在获取多源历史数据之后,可以从中提取特征数据。其中,从股市量化数据的数值类数据以及从新闻标题数据、网络评价数据的文本类数据中提取特征数据的过程,可以参见相关技术。
s103:基于参考股票的多源历史数据的特征数据,对目标股票的多源历史数据的特征数据进行修正,得到目标股票的修正数据。
本发明实施例中,为了提高预测准确度,考虑了相关股票之间的内在联系。具体的,由于参考股票都是与目标股票相关的,即参考股票和目标股票具有相似的波动趋势,因此可以基于参考股票的多源历史数据的特征数据,对目标股票的多源历史数据的特征数据进行修正,得到目标股票的修正数据,即目标股票的修正数据中隐含了参考股票的特征数据。
s104:将修正数据输入预测模型,得到目标股票的波动预测结果,预测模型是根据样本股票的多源历史数据的特征数据,以及样本股票已知的波动数据训练得到的。
本发明实施例中,在得到目标股票的修正数据后,可以将修正数据输入预测模型,由于预测目标是根据样本股票的多源历史数据的特征数据,以及样本股票已知的波动数据预先训练的,因此可以输出目标股票的波动预测结果。其中,波动预测结果包括涨或者跌。
采用本发明实施例提供的股票波动预测方法,获取待预测的目标股票的多源历史数据,以及与目标股票相关的参考股票的多源历史数据;其中,股票的多源历史数据包括:在预测时间点之前预设数量个单位时间的每个单位时间内与股票相关的股市量化数据,新闻标题数据以及网络评价数据;从多源历史数据中提取特征数据;基于参考股票的多源历史数据的特征数据,对目标股票的多源历史数据的特征数据进行修正,得到目标股票的修正数据;将修正数据输入预测模型,得到目标股票的波动预测结果,预测模型是根据样本股票的多源历史数据的特征数据,以及样本股票已知的波动数据训练得到的。可见,综合考虑了多个数据源的历史数据,包括股市量化数据,新闻标题数据以及网络评价数据,相比于现有的仅考虑股票历史定量数据的股票预测方案,能够更准确的捕捉股票波动的趋势,此外,使用参考股票的特征数据对目标股票的特征数据进行修正,即考虑了目标股票与参考股票之间的内在联系,能够进一步提高股票波动预测结果。
在本发明的一种实施例中,特征数据可以包括第一特征数据,第二特征数据和第三特征数据,上述步骤s102,具体可以包括以下细化步骤:
步骤a:将股市量化数据标准化,得到第一特征数据。
具体的,第一特征数据是对股市量化数据进行特征提取后得到的,第二特征数据是对新闻标题数据进行特征提取后得到的,第三特征数据是对网络评价数据进行特征提取后得到的。
针对股市量化数据,例如,开盘价、收盘价、最高价、最低价等,均为数值类数据,因此将其标准化之后,即可作为第一特征数据。
步骤b:对新闻标题数据进行分词,并将分词得到的词语转换为第一词语向量,得到第二特征数据。
作为一个示例,可以使用jieba对新闻标题进行分词,然后采用预先训练的word2vector模型将分词转换为词语向量的形式。随后,针对每个股票,可以将每个单位时间内的新闻标题数据转换得到的词语向量进行平均,作为第二特征数据。
步骤c:对网络评价数据进行分词,并将分词后的词语转换为第二词语向量,从第二词语向量中提取情感数据,得到第三特征数据,情感数据包括积极情感数据和消极情感数据。
针对网络评估数据,目的是提取网络评价中的情感,包括积极情感和消极情感。举例来讲,若针对某只股票相关企业的评价为负面评价,则表示的情感为消极情感,若为正面评价,则表示的情感为积极情感。
作为一个示例,可以使用双向长短时记忆模型来提取情感数据。具体的,可以获取大量的金融社交网络帖子,这些金融社交网络帖子中包含大量的网络评价数据,对网络评价数据进行分词,再转换为词语向量的形式,用于训练双向长短时记忆神经网络。训练好的长短时记忆神经网络能够输出网络评价数据对应的情感数据。
其中,长短时记忆神经网络的构建及训练过程可以参见相关技术,不做赘述。
可见,不同于现有的仅考虑股票历史定量数据的股票波动预测方法,本发明实施例提供的股票波动预测方法还从新闻标题数据,网络评价数据中提取有效信息,能够更准确的捕捉股票波动的趋势,提高预测准确度。
在本发明的一种实施例中,参见图2,上述步骤s103,具体可以包括以下细化步骤:
s1031:将目标股票的多源历史数据的特征数据以及参考股票的多源历史数据的特征数据输入注意力网络中,得到目标股票与各个参考股票的相似度。
作为一个示例,设目标股票为xsk,参考股票可以为股票集合xs=[xs1,xs2,...,xsi,...xsr],即总共r个参考股票,设第i个参考股票xsi的特征数据为xsi,目标股票xsk的特征数据为xsk。
将股票集合里的每个参考股票的特征数据和目标股票的特征数据输入预先训练的注意力网络中,得到第i个参考股票与目标股票的注意力分数qi,qi可作为第i个参考股票与目标股票的相似度。
值得说明的是,s102中提取到的特征数据可以表示为时间序列,即每个单位时间对应一个特征数据,在将特征数据输入注意力网络时,可以循环重叠截取其中的特定步长的数据作为训练数据。
举例来讲,单位时间为一天,特征数据的总步长为10,即10天内每一天对应一个特征数据,预设的特定步长为8,设第i个参考股票xsi的特征数据xsi为a1,a2,a3,a4,a5,a6,a7,a8,a9和a10,其中,a1表示第一天对应的特征数据,则可以按照特征步长对特征数据xsi进行循环重叠截取,得到分别包含【a1,a2,a3,a4,a5,a6,a7,a8】、【a2,a3,a4,a5,a6,a7,a8,a9】和【a3,a4,a5,a6,a7,a8,a9,a10】的三个特征序列,作为网络的输入。具体的截取步长可以根据实际需求进行设定。
其中,注意力网络计算第i个参考股票xsi与目标股票的相似度,可以用如下公式表示:
qi=vsttanh(wsxsi+wmxsk)
其中,qi表示第i个参考股票xsi与目标股票xsk的相似度,vs,ws和wm为预设的权重矩阵。
s1032:基于相似度,确定各个参考股票的加权权重。
具体的,可以对相似度进行归一化,得到各个参考股票的加权权重。
用公式可以表示为:
其中,αi表示第i个参考股票xsi的加权权重。
s1033:基于加权权重,对目标股票的特征数据进行加权求和,并根据加权求和结果对目标股票的特征数据进行修正,得到目标股票的修正数据。
进一步的,可以根据加权权重,对目标股票的特征数据进行加权求和,求和结果ds可以表示为:
进而,可以根据参考股票的特征数据的加权求和结果对目标股票的特征数据进行修正,得到目标股票的修正数据。
可见,本发明实施例中,使用参考股票的特征数据对目标股票的特征数据进行修正,即考虑了目标股票与参考股票之间的内在联系,能够进一步提高股票波动预测结果。
在本发明的一种实施例中,为了从多源历史数据中学习低阶和高阶的特征数据交互,进一步提高预测准确度,可以构建包含因子分解机模型和深度神经网络模型的并行网络。
具体的,预测模型可以包括因子分解机模型和深度神经网络模型,参见图3,可以按照如下步骤训练预测模型:
s301:获取预设的因子分解机模型和深度神经网络模型。
本步骤中,获取待训练的因子分解机模型和深度神经网络模型,模型中的参数为初始化参数。
s302:将样本股票的多源历史数据的特征数据分别输入因子分解机模型和深度神经网络模型,得到因子分解机模型的第一输出结果和深度神经网络模型的第二输出结果。
本发明实施例中,因子分解机模型的第一输出结果可以表示为:
其中,yfm表示因子分解机模型的第一输出结果,xi表示第i个特征向量,xj表示第j个特征向量,wi表示xi的预设加权权重,n表示特征向量的类别,本发明实施例中考虑了股市量化数据,新闻标题数据以及网络评价数据这三个数据源的特征数据,因此n值为3。vi表示特征向量xi对应的隐向量,vj表示特征向量xj对应的隐向量,⊙和
可见,
深度神经网络模型的第二输出结果可以表示为:
其中,h1表示第一层深度神经网络模型的输出,
s303:聚合第一输出结果和第二输出结果,得到样本股票的波动预测结果。
本发明实施例中,可以采用全连接层将第一输出结果和第二输出结果聚合在一起,即可得到样本股票的波动预测结果。
s304:将波动预测结果,以及样本股票已知的波动数据代入预先设置的损失函数,确定损失值。
本发明实施例中,包括但不限于使用均方误差(meansquarederror,mse)公式作为损失函数,得到损失值。
作为一个示例,损失函数可以为:
其中,n表示样本股票的总数,yi表示样本股票的已知的波动数据,yi′表示样本股票的波动预测结果。
s305:基于损失值判断预测模型是否收敛,若未收敛,执行s306;若收敛,执行s307。
s306:调整因子分解机模型和深度神经网络模型中的参数值,并返回s302。
s307:将当前的预测模型确定为训练完成的预测模型。
可见,本发明实施例中,构建包含因子分解机模型和深度神经网络模型的并行的预测模型,这种网络结果能够从多源历史数据中学习低阶和高阶特征交互,具体为因子分解机模型学习特征间的二阶交互,深度神经网络模型学习特征间的高阶交互,从而将股市量化数据、新闻标题数据和网络评价数据融合,捕获不同信息源之间的内在联系,提高股票波动的预测准确度。
需要说明的是,注意力网络和预测网络可以分别训练,也可以作为一个整体进行训练,若作为一个整体网络进行训练,则将注意力表示层的输出作为预测模型的输入,对注意力表示层和预测模型中的参数整体进行训练。具体根据需求进行选择。
为了便于理解,下面结合附图4,进一步对本发明实施例提供的股票波动预测进行说明。
如图4所示,目标股票的多源历史数据和参考股票的多源历史数据经过特征提取后输入注意力表示网络层,该网络层学习股票之间的内在联系,采用参考股票的特征对目标股票的特征进行修正,随后将修正特征分别输入因子分解机模型和深度神经网络模型,再通过全连接层聚合因子分解机模型和深度神经网络模型的输出结果,随后输出层输出最终的股票波动预测结果。
相应于本发明实施例提供的股票波动预测方法,本发明实施例提供了一种股票波动预测装置,参见图5,可以包括如下模块:
获取模块501,用于获取待预测的目标股票的多源历史数据,以及与目标股票相关的参考股票的多源历史数据;其中,股票的多源历史数据包括:在预测时间点之前预设数量个单位时间的每个单位时间内与股票相关的股市量化数据,新闻标题数据以及网络评价数据;
提取模块502,用于从多源历史数据中提取特征数据;
修正模块503,用于基于参考股票的多源历史数据的特征数据,对目标股票的多源历史数据的特征数据进行修正,得到目标股票的修正数据;
预测模块504,用于将修正数据输入预测模型,得到目标股票的波动预测结果,预测模型是根据样本股票的多源历史数据的特征数据,以及样本股票已知的波动数据训练得到的。
在本发明的一种实施例中,特征数据包括第一特征数据,第二特征数据和第三特征数据;提取装置502,具体用于:
将股市量化数据标准化,得到第一特征数据;
对新闻标题数据进行分词,并将分词得到的词语转换为第一词语向量,得到第二特征数据;
对网络评价数据进行分词,并将分词后的词语转换为第二词语向量,从第二词语向量中提取情感数据,得到第三特征数据,情感数据包括积极情感数据和消极情感数据。
在本发明的一种实施例中,修正模块503,具体可以用于:
将目标股票的多源历史数据的特征数据以及参考股票的多源历史数据的特征数据输入注意力网络中,得到目标股票与各个参考股票的相似度;
基于相似度,确定各个参考股票的加权权重;
基于加权权重,对目标股票的特征数据进行加权求和,并根据加权求和结果对目标股票的特征数据进行修正,得到目标股票的修正数据。
在本发明的一种实施例中,预测模型包括因子分解机模型和深度神经网络模型,在图5所示装置基础上,还可以包括训练模块,训练模块用于:
获取预设的因子分解机模型和深度神经网络模型;
将样本股票的多源历史数据的特征数据分别输入因子分解机模型和深度神经网络模型,得到因子分解机模型的第一输出结果和深度神经网络模型的第二输出结果;
聚合第一输出结果和第二输出结果,得到样本股票的波动预测结果;
将波动预测结果,以及样本股票已知的波动数据代入预先设置的损失函数,确定损失值;
基于损失值判断预测模型是否收敛,若否,则调整因子分解机模型和深度神经网络模型中的参数值,并返回将样本股票的多源历史数据的特征数据分别输入因子分解机模型和深度神经网络模型的步骤;
若是,则将当前的预测模型确定为训练完成的预测模型。
采用本发明实施例提供的股票波动预测装置,获取待预测的目标股票的多源历史数据,以及与目标股票相关的参考股票的多源历史数据;其中,股票的多源历史数据包括:在预测时间点之前预设数量个单位时间的每个单位时间内与股票相关的股市量化数据,新闻标题数据以及网络评价数据;从多源历史数据中提取特征数据;基于参考股票的多源历史数据的特征数据,对目标股票的多源历史数据的特征数据进行修正,得到目标股票的修正数据;将修正数据输入预测模型,得到目标股票的波动预测结果,预测模型是根据样本股票的多源历史数据的特征数据,以及样本股票已知的波动数据训练得到的。可见,综合考虑了多个数据源的历史数据,包括股市量化数据,新闻标题数据以及网络评价数据,相比于现有的仅考虑股票历史定量数据的股票预测方案,能够更准确的捕捉股票波动的趋势,此外,使用参考股票的特征数据对目标股票的特征数据进行修正,即考虑了目标股票与参考股票之间的内在联系,能够进一步提高股票波动预测结果。
相应于股票波动预测方法实施例,本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
处理器601,用于执行存储器603上所存放的程序时,实现如下步骤:
获取待预测的目标股票的多源历史数据,以及与目标股票相关的参考股票的多源历史数据;其中,股票的多源历史数据包括:在预测时间点之前预设数量个单位时间的每个单位时间内与股票相关的股市量化数据,新闻标题数据以及网络评价数据;
从多源历史数据中提取特征数据;
基于参考股票的多源历史数据的特征数据,对目标股票的多源历史数据的特征数据进行修正,得到目标股票的修正数据;
将修正数据输入预测模型,得到目标股票的波动预测结果,预测模型是根据样本股票的多源历史数据的特征数据,以及样本股票已知的波动数据训练得到的。
上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
采用本发明实施例提供的电子设备,获取待预测的目标股票的多源历史数据,以及与目标股票相关的参考股票的多源历史数据;其中,股票的多源历史数据包括:在预测时间点之前预设数量个单位时间的每个单位时间内与股票相关的股市量化数据,新闻标题数据以及网络评价数据;从多源历史数据中提取特征数据;基于参考股票的多源历史数据的特征数据,对目标股票的多源历史数据的特征数据进行修正,得到目标股票的修正数据;将修正数据输入预测模型,得到目标股票的波动预测结果,预测模型是根据样本股票的多源历史数据的特征数据,以及样本股票已知的波动数据训练得到的。可见,综合考虑了多个数据源的历史数据,包括股市量化数据,新闻标题数据以及网络评价数据,相比于现有的仅考虑股票历史定量数据的股票预测方案,能够更准确的捕捉股票波动的趋势,此外,使用参考股票的特征数据对目标股票的特征数据进行修正,即考虑了目标股票与参考股票之间的内在联系,能够进一步提高股票波动预测结果。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一方法步骤。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于股票波动预测装置、电子设备和计算机可读存储介质实施例,由于其基本相似于股票波动预测方法实施例,所以描述的比较简单,相关之处参见股票波动预测方法实施例的部分说明即可。
以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。