本申请实施例涉及数据处理,具体涉及一种模拟数据生成方法和系统。
背景技术:
1、金融市场环境数据通常包括用于资产定价的风险中性数据、用于风险评估的蒙特卡洛数据、用于金融策略分析的历史行情数据等。传统上基于black-scholes定价模型需要的数据是风险中性的,而并非市场的实际可能行情。同时风险评估需要未来金融市场中资产价格的可能路径,用来评估最糟糕情景下和最可能情景下的资产盈亏,也无法直接使用历史数据度量真实市场的风险。现有技术往往基于统计手段或专家规则,一些重要金融资产的特殊属性使得现有的方法大部分失效。
2、对于金融市场环境数据的假设和不足,使得现有的金融市场环境数据不能很好地适配来自真实市场的需求,特别是当需要考虑的时间段比较长的情况。目前的数据方法无法生成服从风险中性分布的对数收益期权估值,无法生成满足鞅过程的对冲时间序列数据,但是对冲齐全对又需要在特定的风险中性环境下进行模型运算。同时,这种方法不是数据驱动的模型,而是基于一系列专家给定的规则,这使得生成的数据受到了极大的限制,专家规则无法穷尽所有自然规律,也很难规定高维的数据统计特性,因此现有的金融市场环境数据往往只在一阶或者二阶统计量上较为接近真实数据,但是高维统计量则与真实数据相差很远,因此现有的技术方案生成数据的质量并不高。
技术实现思路
1、为此,本申请实施例提供一种模拟数据生成方法和系统,辅以鞅过程变换,使得生成的模拟数据可以服从鞅过程,进而满足量化风险中性对冲的条件。
2、为了实现上述目的,本申请实施例提供如下技术方案:
3、根据本申请实施例的第一方面,提供了一种模拟数据生成方法,所述方法包括:
4、接收模拟数据生成请求,所述模拟数据生成请求携带原始数据;
5、计算所述原始数据的协方差矩阵并分解得到对角矩阵;
6、利用所述对角矩阵对所述原始数据进行线性变换,训练目标模型;
7、将所述原始数据输入所述目标模型得到模型合成数据;
8、将所述模型合成数据经过所述对角矩阵进行线性变换,得到目标模拟数据。
9、可选地,所述目标模型包括数据采样模块、样本预处理模块和合成数据生成模块;
10、所述将所述原始数据输入所述目标模型得到模型合成数据,包括:
11、将所述原始数据输入所述目标模型的数据采样模块得到采样数据;
12、将所述采样数据输入所述样本预处理模块得到样本数据;
13、将样本数据输入合成数据生成模块生成模型合成数据。
14、可选地,在所述将所述原始数据输入所述目标模型得到模型合成数据之前,所述方法还包括:
15、模型匹配器根据输入的所述原始数据在模型库中进行模型匹配;
16、若匹配成功,将匹配到的模型确定为目标模型;
17、若匹配不成功,则使用模型训练器基于所述原始数据进行机器学习的模型训练。
18、可选地,所述方法还包括:
19、训练后的模型输入模型质检器,若不通过,则调整参数;若通过,则将模型存入所述模型库。
20、可选地,所述训练目标模型按照如下步骤:
21、生成目标模型的对抗网络,最小化生成器g的损失函数值,同时最大化判别器d的损失函数值,按照如下公式搭建对抗网络:
22、
23、其中,x~pdata(x)表示从真实的数据分布pdata(x)中采样出样本x,计算出样本x通过判别器后的结果d(x)取对数,z~pz(z)表示从随时分布pz(z)中抽取一个随机数z,g(z)表示随机数z输入生成器g得到的合成数据,d(g(z))表示合成数据输入判别器d中得到判别器结果。
24、可选地,在计算原始数据的协方差矩阵之前,所述方法还包括:
25、对所述原始数据进行样本数据质量评估,若不满足条件,则进行数据清洗、数据集成、数据转换、数据简化,直到满足样本数据质量评估条件,完成原始数据的预处理。
26、可选地,所述方法还包括:
27、按照如下公式将目标模拟数据计算现货价格序列:
28、
29、
30、其中,为风险中性对数收益,r为利率,θ为收益率,s0,θ为基础资产的当前价格,μ为均值,σ为方差,t为时刻,m为修正后对应的值,h是一个函数,具体定义如下:
31、e[exp(rt,θ)|ft-1]:=h(σt,θ,μt,θ)
32、其中,f是一个秧过程。
33、根据本申请实施例的第二方面,提供了一种模拟数据生成系统,所述系统包括:
34、请求接收模块,用于接收模拟数据生成请求,所述模拟数据生成请求携带原始数据;
35、对角矩阵模块,用于计算所述原始数据的协方差矩阵并分解得到对角矩阵;
36、模型训练模块,用于利用所述对角矩阵对所述原始数据进行线性变换,训练目标模型;
37、合成数据模块,用于将所述原始数据输入所述目标模型得到模型合成数据;
38、模拟数据模块,用于将所述模型合成数据经过所述对角矩阵进行线性变换,得到目标模拟数据。
39、根据本申请实施例的第三方面,提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行以实现上述第一方面所述的方法。
40、根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述第一方面所述的方法。
41、综上所述,本申请实施例提供了一种模拟数据生成方法和系统,通过接收模拟数据生成请求,所述模拟数据生成请求携带原始数据;计算所述原始数据的协方差矩阵并分解得到对角矩阵;利用所述对角矩阵对所述原始数据进行线性变换,训练目标模型;将所述原始数据输入所述目标模型得到模型合成数据;将所述模型合成数据经过所述对角矩阵进行线性变换,得到目标模拟数据。辅以鞅过程变换,使得生成的模拟数据可以服从鞅过程,进而满足量化风险中性对冲的条件。
1.一种模拟数据生成方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述目标模型包括数据采样模块、样本预处理模块和合成数据生成模块;
3.如权利要求1所述的方法,其特征在于,在所述将所述原始数据输入所述目标模型得到模型合成数据之前,所述方法还包括:
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
5.如权利要求1所述的方法,其特征在于,所述训练目标模型按照如下步骤:
6.如权利要求1所述的方法,其特征在于,在计算原始数据的协方差矩阵之前,所述方法还包括:
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种模拟数据生成系统,其特征在于,所述系统包括:
9.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序时执行以实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1-7任一项所述的方法。