一种数据处理方法及系统与流程

文档序号：28959981发布日期：2022-02-19 12:42阅读：139来源：国知局

1.本技术涉及数据处理技术领域，更具体地说，涉及一种数据处理方法及系统。

背景技术：

2.公募基金(public offering offund)是指以公开方式向社会公众投资者募集资金并以证券为主要投资对象的证券投资基金。
3.公募基金在严格监管下，有着信息披露，利润分配，运行限制等行业规范。用户获取公募基金可通过推送的方式得到。
4.证劵公司向客户销售基金的主要方式之一是通过推送的方式，现有的公募基金的推送方式单一，且没有规律性，无法满足用户获取最优的公募基金的需求，从而导致用户体验差。

技术实现要素：

5.有鉴于此，本技术公开了一种数据处理方法及系统，旨在从备选基金池中获取最优基金组合，并对最优基金组合执行推送操作，使得用户得到最优基金组合，提高用户体验。
6.为了实现上述目的，其公开的技术方案如下：
7.本技术第一方面公开了一种数据处理方法，所述方法包括：
8.获取市场股票信息组合，并将所述市场股票信息组合进行向量化，得到股票组合向量；
9.通过符合预设条件的公募基金披露的当前时刻的重仓股信息以及预设股票向量，对所述公募基金进行向量化，得到所述公募基金对应的各个向量；所述预设股票向量为所述市场股票信息组合的每支个股的预设形式的向量；
10.将所述公募基金对应的各个向量拼接成基金矩阵；
11.基于所述股票组合向量和所述基金矩阵，确定备选基金池；所述备选基金池包括多个基金；
12.通过预设算法对所述备选基金池中的基金进行计算，得到最优基金组合；
13.对所述最优基金组合执行推送操作。
14.优选的，所述获取市场股票信息，并将所述市场股票信息进行向量化处理，得到股票组合向量，包括：
15.获取市场股票信息组合对应的权重；
16.通过所述权重对所述股票信息组合中的股票向量进行加权求和，得到股票组合向量。
17.优选的，所述通过符合预设条件的公募基金披露的当前时刻的重仓股信息以及预设股票向量，对所述公募基金进行向量化，得到所述公募基金对应的各个向量，包括：
18.获取公募基金的权益类基金；所述权益类基金包括股票型基金、偏股混合型基金
和灵活配置型基金；
19.通过所述权益类基金披露的当前时刻的重仓股信息以及预设股票向量，对所述公募基金进行向量化，得到所述公募基金对应的各个向量。
20.优选的，所述基于所述股票组合向量和所述基金矩阵，确定备选基金池，包括：
21.通过预设降维算法对所述基金矩阵进行降维操作，得到降维后的基金矩阵；
22.通过所述预设降维算法对所述股票组合向量进行降维操作，得到降维后的股票组合向量；
23.通过预设聚类算法对所述降维后的基金矩阵进行聚类，得到多个基金类别；
24.通过距离算法和邻近算法，将所述降维后的股票组合向量划分到所述多个基金类别中的目标基金类别，并确定所述目标基金类别为备选基金池。
25.优选的，所述通过预设算法对所述备选基金池中的基金进行计算，得到最优基金组合，包括：
26.通过所述权重对所述市场股票信息组合中的各个股票行情进行加权，得到净值序列和收益率序列；
27.将所述净值序列和所述收益率序列进行拼接，得到第一向量；所述第一向量用于指示所述市场股票信息组合的净值序列和收益率序列拼接得到的向量；
28.将所述备选基金池中各个基金的净值序列和收益率序列进行拼接，得到第二向量；所述第二向量用于指示所述备选基金池中单个基金的净值序列和收益率序列拼接得到的向量；
29.通过所述第二向量对所述第一向量进行带约束的线性回归，得到回归系数；
30.当所述回归系数大于预设系数时，确定所述回归系数为目标权重；
31.从所述备选基金池中选取所述目标权重对应的目标基金组合，并确定所述目标基金组合为最优基金组合。
32.本技术第二方面公开了一种数据处理系统，所述系统包括：
33.获取单元，用于获取市场股票信息组合，并将所述市场股票信息组合进行向量化，得到股票组合向量；
34.向量化单元，用于通过符合预设条件的公募基金披露的当前时刻的重仓股信息以及预设股票向量，对所述公募基金进行向量化，得到所述公募基金对应的各个向量；所述预设股票向量为所述市场股票信息组合的每支个股的预设形式的向量；
35.拼接单元，用于将所述公募基金对应的各个向量拼接成基金矩阵；
36.确定单元，用于基于所述股票组合向量和所述基金矩阵，确定备选基金池；所述备选基金池包括多个基金；
37.计算单元，用于通过预设算法对所述备选基金池中的基金进行计算，得到最优基金组合；
38.执行单元，用于对所述最优基金组合执行推送操作。
39.优选的，所述获取单元，包括：
40.第一获取模块，用于获取市场股票信息组合对应的权重；
41.加权求和模块，用于通过所述权重对所述股票信息组合中的股票向量进行加权求和，得到股票组合向量。
42.优选的，所述向量化单元，包括：
43.第二获取模块，用于获取公募基金的权益类基金；所述权益类基金包括股票型基金、偏股混合型基金和灵活配置型基金；
44.向量化模块，用于通过所述权益类基金披露的当前时刻的重仓股信息以及预设股票向量，对所述公募基金进行向量化，得到所述公募基金对应的各个向量。
45.优选的，所述确定单元，包括：
46.第一降维模块，用于通过预设降维算法对所述基金矩阵进行降维操作，得到降维后的基金矩阵；
47.第二降维模块，用于通过所述预设降维算法对所述股票组合向量进行降维操作，得到降维后的股票组合向量；
48.聚类模块，用于通过预设聚类算法对所述降维后的基金矩阵进行聚类，得到多个基金类别；
49.第一确定模块，用于通过距离算法和邻近算法，将所述降维后的股票组合向量划分到所述多个基金类别中的目标基金类别，并确定所述目标基金类别为备选基金池。
50.优选的，所述计算单元，包括：
51.加权模块，用于通过所述权重对所述市场股票信息组合中的各个股票行情进行加权，得到净值序列和收益率序列；
52.第一拼接模块，用于将所述净值序列和所述收益率序列进行拼接，得到第一向量；所述第一向量用于指示所述市场股票信息组合的净值序列和收益率序列拼接得到的向量；
53.第二拼接模块，用于将所述备选基金池中各个基金的净值序列和收益率序列进行拼接，得到第二向量；所述第二向量用于指示所述备选基金池中单个基金的净值序列和收益率序列拼接得到的向量；
54.线性回归模块，用于通过所述第二向量对所述第一向量进行带约束的线性回归，得到回归系数；
55.第二确定模块，用于当所述回归系数大于预设系数时，确定所述回归系数为目标权重；
56.第三确定模块，用于从所述备选基金池中选取所述目标权重对应的目标基金组合，并确定所述目标基金组合为最优基金组合。
57.经由上述技术方案可知，本技术公开了一种数据处理方法及系统，获取市场股票信息组合，并将市场股票信息组合进行向量化，得到股票组合向量，通过符合预设条件的公募基金披露的当前时刻的重仓股信息以及预设股票向量，对公募基金进行向量化，得到公募基金对应的各个向量，预设股票向量为市场股票信息组合的每支个股的预设形式的向量，将公募基金对应的各个向量拼接成基金矩阵，基于股票组合向量和基金矩阵，确定备选基金池，备选基金池包括多个基金，通过预设算法对备选基金池中的基金进行计算，得到最优基金组合，对最优基金组合执行推送操作。通过上述方案，从备选基金池中获取最优基金组合，并对最优基金组合执行推送操作，使得用户得到该最优基金组合，提高用户体验。
附图说明
58.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。
59.图1为本技术实施例公开的一种数据处理方法的流程示意图；
60.图2为本技术实施例公开的得到股票组合向量的流程示意图；
61.图3为本技术实施例公开的得到公募基金对应的各个向量的流程示意图；
62.图4为本技术实施例公开的基于股票组合向量和基金矩阵，确定备选基金池的流程示意图；
63.图5为本技术实施例公开的得到最优基金组合的流程示意图；
64.图6为本技术实施例公开的一种数据处理系统的结构示意图。
具体实施方式
65.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
66.在本技术中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
67.由背景技术可知，现有的公募基金的推送方式单一，且没有规律性，无法满足用户获取最优的公募基金的需求，从而导致用户体验差。
68.为了解决上述问题，本技术实施例公开了一种数据处理方法及系统，从备选基金池中获取最优基金组合，并对最优基金组合执行推送操作，使得用户得到该最优基金组合，提高用户体验。具体实现方式通过下述实施例进行说明。
69.参考图1所示，为本技术实施例公开的一种数据处理方法的流程示意图，该数据处理方法主要包括如下步骤：
70.s101：获取市场股票信息组合，并将市场股票信息组合进行向量化，得到股票组合向量。
71.其中，市场股票信息组合为用户选取的多个股票信息所构成的组合。例如，用户选取a股、b股和d股，则将a股、b股和d股作为市场股票信息组合。
72.将市场股票信息组合的每支个股表示为one-hot向量形式。
73.例如，若市场共有n支股票，则第i支股票的one-hot向量形式的表达式如公式(1)和公式(2)所示。
74.si＝(s1，s2，
…
sn)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
75.其中，si为第i支股票的one-hot向量形式，i的取值为大于等于1的整数s1为股票向量的第1个分量，s2为股票向量的第2个分量，sn为股票向量的第n个分量，n的取值为大于等于1的整数。
[0076][0077]
其中，sj为股票向量的第j个分量，j的取值为大于等于1的整数。
[0078]
具体获取市场股票信息，并将市场股票信息进行向量化处理，得到股票组合向量的具体过程如下：
[0079]
首先，获取市场股票信息组合对应的权重。
[0080]
然后，通过权重对股票信息组合中的股票向量进行加权求和，得到股票组合向量。
[0081]
其中，将输入的股票组合按其权重对单个股票向量进行加权求和，得到股票组合向量。
[0082]
股票组合向量的表达式如公式(3)所示。
[0083][0084]
其中，sp为股票组合向量，wi为输入股票组合中，第i只股票对应的权重，k为输入的股票组合中包含的股票数量，k的取值为大于等于1的整数。
[0085]
s102：通过符合预设条件的公募基金披露的当前时刻的重仓股信息以及预设股票向量，对公募基金进行向量化，得到公募基金对应的各个向量；预设股票向量为市场股票信息组合的每支个股的预设形式的向量。
[0086]
在s102中，把封闭式基金剔除，留下开放式基金(近期没有暂停申购，或赎回等)，即为符合预设条件的公募基金。符合预设条件的公募基金包括股票型基金、偏股混合型基金、灵活配置型基金等权益类基金。
[0087]
预设股票向量为市场股票信息组合的每支个股的预设形式，即为市场股票信息组合的每支个股表示为one-hot向量形式。
[0088]
具体通过符合预设条件的公募基金披露的当前向量的重仓股信息以及预设股票向量，对公募基金进行向量化，得到公募基金对应的各个向量，并将公募基金对应的各个向量拼接成基金矩阵的过程如下：
[0089]
首先，获取公募基金的权益类基金；权益类基金包括股票型基金、偏股混合型基金和灵活配置型基金。
[0090]
其中，权益类基金的数量可以为多个。
[0091]
然后，通过权益类基金披露的当前时刻的重仓股信息以及预设股票向量，对公募基金进行向量化，得到公募基金对应的各个向量。
[0092]
其中，公募基金对应的各个向量用fi表示，其中，i的取值为大于等于1的整数。
[0093]
s103：将公募基金对应的各个向量拼接成基金矩阵。
[0094]
其中，将公募基金对应的各个向量拼接成m
×
n阶基金矩阵。
[0095]m×
n阶基金矩阵的表达式如公式(4)所示。
[0096][0097]
其中，mf为m阶维空间的n个基金向量构成的基金矩阵，f1为第1只基金对应的向量，fm为第m只基金对应的向量，m的取值为大于等于1的整数，n的取值为大于等于1的整数。
[0098]
s104：基于股票组合向量和基金矩阵，确定备选基金池；备选基金池包括多个基
金。
[0099]
在s104中，备选基金池中包括用户需求的多个股票的基金。
[0100]
首先，通过预设降维算法对基金矩阵进行降维操作，得到降维后的基金矩阵。
[0101]
其中，预设降维算法可以是主成分分析(principal componentanalysis，pca)算法，也可以是其他算法，本技术的预设降维算法由技术人员根据实际情况进行设置，本技术不做具体限定。本技术的预设降维算法优选pca算法。
[0102]
对基金矩阵mf采用pca算法进行降维，保留使方差解释度达到85％的前p个主成分，得到降维后的基金矩阵。
[0103]
降维后的基金矩阵的表达式如公式(5)所示。
[0104][0105]
其中，mf′
为降维后的基金矩阵，f1′
为第1只基金降维后的向量，fm′
为m只基金降维后的向量，p表示根据方差解释度阈值确定出来的应保留主成分个数；p的取值随mf不同而变化，p的取值范围为大于等于1的整数，p可以看作是mf的函数。
[0106]
其次，通过预设降维算法对股票组合向量进行降维操作，得到降维后的股票组合向量sp
′
。
[0107]
其中，通过pca算法对股票组合向量sp进行降维，得到降维后的股票组合向量sp
′
。
[0108]
然后，通过预设聚类算法对降维后的基金向量进行聚类，得到多个基金类别。
[0109]
其中，预设聚类算法可以是k-means聚类算法，也可以是其他聚类算法，本技术的预设聚类算法由技术人员根据实际情况进行设置，本技术不做具体限定。本技术的预设聚类算法优选k-means聚类算法。
[0110]
对降维后的基金矩阵mf′
，采用k-means聚类算法进行行间聚类，得到c个基金类别。
[0111]
c为预先确定要划分的基金类别数，c的取值优选20，c的取值范围为10-40。
[0112]
最后，通过距离算法和邻近算法，将降维后的股票组合向量划分到多个基金类别中的目标基金类别，并确定目标基金类别为备选基金池。
[0113]
其中，将股票组合以欧氏距离为标准，可使用knn方法将降维后的股票组合向量划分入多个基金类别中的一个基金类别(目标基金类别)中，包含降维后的股票组合向量的目标基金类别即为备选基金池。
[0114]
s105：通过预设算法对备选基金池中的基金进行计算，得到最优基金组合。
[0115]
具体通过预设算法对备选基金池中的基金进行计算，得到最优基金组合的过程如a1-a6所示。
[0116]
a1：通过权重对市场股票信息组合中的各个股票行情进行加权，得到净值序列和收益率序列。
[0117]
其中，各个股票行情包括价格(净值序列)、涨跌幅(收益率序列)等。
[0118]
假设考察过去t个交易日的市场表现，将股票组合按其权重进行指数化，即用权重对股票组合中每支股票的价格(这个价格是归一化处理后的价格)进行加权，得到净值序列和收益率序列。
[0119]
净值序列的表达式如公式(6)所示。
[0120]
v＝(v1，
…vt
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0121]
其中，v为净值序列，v1为第1个交易日的净值，v
t
为第t个交易日的净值，t的取值为大于1的整数。
[0122]
收益率序列的表达式如公式(7)所示。
[0123]
r＝(r1，
…rt
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0124]
其中，r为收益率序列，r1为第1个交易日的收益率，r
t
为第t个交易日的收益率，t的取值为大于1的整数。
[0125]
a2：将净值序列和收益率序列进行拼接，得到第一向量；第一向量用于指示市场股票信息组合的净值序列和收益率序列拼接得到的向量。
[0126]
第一向量的表达式如公式(8)所示。
[0127]
y＝(v，r)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0128]
其中，y为第一向量，v为净值序列，r为收益率序列。
[0129]
a3：将备选基金池中各个基金的净值序列和收益率序列进行拼接，得到第二向量；第二向量用于指示备选基金池中单个基金的净值序列和收益率序列拼接得到的向量。
[0130]
其中，将备选基金池中每个基金的净值序列、收益率序列分别进行拼接，得到第二向量。
[0131]
第二向量用x表示，其中，x＝(x1，
…
，xc)。
[0132]
x1为第二向量的第1个分量，xc为第二向量的第c个分量，c的取值为大于1的整数。
[0133]
第二向量的数量可以为多个。
[0134]
a4：通过第一向量对第二向量进行带约束的线性回归，得到回归系数。
[0135]
其中，为了使得到的基金组合与所输入的股票组合的行情走势尽可能保持一致，求出使y与x间残差平方和达到最小的回归系数β。由于y和x均包含净值序列与收益率序列两部分，因此可以更全面地刻画出行情表现，其中净值部分主要体现了幅度因素，收益率部分则主要考虑了日度波动方向。
[0136]
x对y进行带约束的线性回归的表达式如公式(9)所示。
[0137][0138]
其中，s.t.为使得，βi为β向量的第i个分量，为任意i，c为β向量长度。
[0139]
采用投影批量梯度下降法对回归系数进行迭代求解，至损失函数不再下降，或达到最大迭代次数停止。
[0140]
a5：当回归系数大于预设系数时，确定回归系数为目标权重。
[0141]
其中，把回归系数小于预设系数的基金剔除，把回归系数大于预设系数的基金进行归一化，大于预设系数的基金即为目标基金组合，其相应的回归系数即为目标权重。
[0142]
预设系数可以是0.01，也可以是0.02，具体预设系数的确定由技术人员根据实际情况进行设置，本技术不做具体限定。本技术的预设系数优选0.01。
[0143]
a6：从备选基金池中选取目标权重对应的目标基金组合，并确定目标基金组合为
最优基金组合。
[0144]
其中，由于目标基金组合中的收益率与用户所选的股票组合的收益率一致，且公募基金组合的历史收益与股票组合的历史收益相匹配，因此确定该目标基金组合为最优基金组合。
[0145]
s106：对最优基金组合执行推送操作。
[0146]
在s106中，对最优基金组合执行推送操作，使得用户根据该最优基金组合进行相应的投资，提高用户体验。
[0147]
例如，得到的最优基金组合就是具体的投资标的。如最优基金组合为a基金：60％，b基金：40％，可投资金额100元，则实际投资组合为a基金申购60元，b基金申购40元。
[0148]
当用户看好单个或多个股票，希望得到持有这些股票的公募基金，使得对应公募基金的收益率与所选的股票组合的收益率一致。通过本方案将市场股票组合转化为公募基金组合，使得公募基金组合持有对应股票，且公募基金组合的历史收益与股票组合的历史收益相匹配。
[0149]
本技术同时满足了公募基金持仓股票、公募基金历史收益曲线两个约束条件，输出的公募基金组合的历史收益曲线，与股票组合的历史收益曲线高度匹配，同时由于考虑了公募基金的重仓股，对基金组合未来走势与股票组合的相似做保证，使得用户购买基金能够得到与股票相似的收益，提高用户体验。
[0150]
本技术实施例中，从备选基金池中获取最优基金组合，并对最优基金组合执行推送操作，使得用户得到该最优基金组合，提高用户体验。
[0151]
参考图2所示，为上述s101中涉及到的获取市场股票信息组合，并将市场股票信息组合进行向量化，得到股票组合向量的过程，主要包括如下步骤：
[0152]
s201：获取市场股票信息组合对应的权重。
[0153]
s202：通过权重对股票信息组合中的股票向量进行加权求和，得到股票组合向量。
[0154]
s201-s202的执行原理与上述s101中涉及到的获取市场股票信息组合，并将市场股票信息组合进行向量化，得到股票组合向量的执行原理一致，可参考，此处不再进行赘述。
[0155]
本技术实施例中，获取市场股票信息组合对应的权重，通过权重对股票信息组合中的股票向量进行加权求和，实现得到股票组合向量的目的。
[0156]
参考图3所示，为上述s102中涉及到的通过符合预设条件的公募基金披露的当前时刻的重仓股信息以及预设股票向量，对公募基金进行向量化，得到公募基金对应的各个向量的过程，主要包括如下步骤：
[0157]
s301：获取公募基金的权益类基金；权益类基金包括股票型基金、偏股混合型基金和灵活配置型基金。
[0158]
s302：通过权益类基金披露的当前时刻的重仓股信息以及预设股票向量，对公募基金进行向量化，得到公募基金对应的各个向量。
[0159]
s301-s302的执行原理与上述s102中通过符合预设条件的公募基金的重仓股信息以及预设股票向量，对公募基金进行向量化，得到公募基金对应的各个向量的执行原理一致，可参考，此处不再进行赘述。
[0160]
本技术实施例中，获取公募基金的权益类基金，通过权益类基金披露的当前时刻
的重仓股信息以及预设股票向量，对公募基金进行向量化，得到公募基金对应的各个向量，将公募基金对应的各个向量拼接成基金矩阵，实现得到基金矩阵的目的。
[0161]
参考图4所示，为上述s104中涉及到基于股票组合向量和基金矩阵，确定备选基金池的过程，主要包括如下步骤：
[0162]
s401：通过预设降维算法对基金矩阵进行降维操作，得到降维后的基金矩阵。
[0163]
s402：通过预设降维算法对股票组合向量进行降维操作，得到降维后的股票组合向量。
[0164]
s403：通过预设聚类算法对降维后的基金矩阵进行聚类，得到多个基金类别。
[0165]
s404：通过距离算法和邻近算法，将降维后的股票组合向量划分到多个基金类别中的目标基金类别，并确定目标基金类别为备选基金池。
[0166]
s401-s404的执行原理与上述s104中涉及到基于股票组合向量和基金矩阵，确定备选基金池的执行原理一致，可参考，此处不再进行赘述。
[0167]
本技术实施例中，通过对股票组合向量和基金矩阵进行降维操作，得到降维后的股票组合向量和多个基金类别，通过距离算法和邻近算法，将降维后的股票组合向量划分到多个基金类别中的目标基金类别，确定目标基金类别为备选基金池，实现确定备选基金池的目的。
[0168]
参考图5所示，为上述s105中涉及到的通过预设算法对备选基金池中的基金进行计算，得到最优基金组合的过程，主要包括如下步骤：
[0169]
s501：通过权重对市场股票信息组合中的各个股票行情进行加权，得到净值序列和收益率序列。
[0170]
s502：将净值序列和收益率序列进行拼接，得到第一向量；第一向量用于指示市场股票信息组合的净值序列和收益率序列拼接得到的向量。
[0171]
s503：将备选基金池中各个基金的净值序列和收益率序列进行拼接，得到第二向量；第二向量用于指示备选基金池中单个基金的净值序列和收益率序列拼接得到的向量。
[0172]
s504：通过第一向量对第二向量进行带约束的线性回归，得到回归系数。
[0173]
s505：当回归系数大于预设系数时，确定回归系数为目标权重。
[0174]
s506：从备选基金池中选取目标权重对应的目标基金组合，并确定目标基金组合为最优基金组合。
[0175]
s501-s506的执行原理与上述s105中通过预设算法对备选基金池中的基金进行计算，得到最优基金组合的执行原理一致，可参考，此处不再进行赘述。
[0176]
本技术实施例中，通过预设算法对备选基金池中的基金进行计算，得到最优基金组合，使得用户得到该最优基金组合，提高用户体验。
[0177]
基于上述实施例图6公开的一种数据处理方法，本技术实施例还对应公开了一种数据处理系统，如图6所示，该数据处理系统包括获取单元601、向量化单元602、拼接单元603、确定单元604、计算单元605和执行单元606。
[0178]
获取单元601，用于获取市场股票信息组合，并将市场股票信息组合进行向量化，得到股票组合向量。
[0179]
向量化单元602，用于通过符合预设条件的公募基金披露的当前时刻的重仓股信息以及预设股票向量，对公募基金进行向量化，得到公募基金对应的各个向量；预设股票向
量为市场股票信息组合的每支个股的预设形式的向量。
[0180]
拼接单元603，用于将公募基金对应的各个向量拼接成基金矩阵。
[0181]
确定单元604，用于基于股票组合向量和基金矩阵，确定备选基金池；备选基金池包括多个基金。
[0182]
计算单元605，用于通过预设算法对备选基金池中的基金进行计算，得到最优基金组合。
[0183]
执行单元606，用于对最优基金组合执行推送操作。
[0184]
进一步的获取单元601，包括：
[0185]
第一获取模块，用于获取市场股票信息组合对应的权重。
[0186]
加权求和模块，用于通过所述权重对股票信息组合中的股票向量进行加权求和，得到股票组合向量。
[0187]
进一步的，向量化单元602，包括：
[0188]
第二获取模块，用于获取公募基金的权益类基金；所述权益类基金包括股票型基金、偏股混合型基金和灵活配置型基金。
[0189]
向量化模块，用于通过权益类基金披露的当前时刻的重仓股信息以及预设股票向量，对公募基金进行向量化，得到公募基金对应的各个向量。
[0190]
进一步的，确定单元604，包括：
[0191]
第一降维模块，用于通过预设降维算法对基金矩阵进行降维操作，得到降维后的基金矩阵。
[0192]
第二降维模块，用于通过预设降维算法对股票组合向量进行降维操作，得到降维后的股票组合向量。
[0193]
聚类模块，用于通过预设聚类算法对降维后的基金矩阵进行聚类，得到多个基金类别。
[0194]
第一确定模块，用于通过距离算法和邻近算法，将降维后的股票组合向量划分到多个基金类别中的目标基金类别，并确定目标基金类别为备选基金池。
[0195]
进一步的，计算单元605，包括：
[0196]
加权模块，用于通过权重对市场股票信息组合中的各个股票行情进行加权，得到净值序列和收益率序列。
[0197]
第一拼接模块，用于将净值序列和收益率序列进行拼接，得到第一向量；第一向量用于指示市场股票信息组合的净值序列和收益率序列拼接得到的向量。
[0198]
第二拼接模块，用于将备选基金池中各个基金的净值序列和收益率序列进行拼接，得到第二向量；第二向量用于指示备选基金池中单个基金的净值序列和收益率序列拼接得到的向量。
[0199]
线性回归模块，用于通过第二向量对第一向量进行带约束的线性回归，得到回归系数。
[0200]
第二确定模块，用于当回归系数大于预设系数时，确定回归系数为目标权重。
[0201]
第三确定模块，用于从备选基金池中选取目标权重对应的目标基金组合，并确定目标基金组合为最优基金组合。
[0202]
本技术实施例中，从备选基金池中获取最优基金组合，并对最优基金组合执行推
送操作，使得用户得到该最优基金组合，提高用户体验。
[0203]
对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本技术并不受所描述的动作顺序的限制，因为依据本技术，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本技术所必须的。
[0204]
需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于系统类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
[0205]
本技术各实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
[0206]
最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
[0207]
对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下，在其它实施例中实现。因此，本技术将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
[0208]
以上所述仅是本技术的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本技术原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本技术的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨伟;柳靖;赵国豪;李伟;郭振海;佘巍巍;文锋;李子康;茹明昊;张鲁晶;张昊
技术所有人：中信证券股份有限公司
我是此专利的发明人

上一篇：一种生物科技用疫苗实验设备的制作方法
上一篇：一种便于更换的粉末冶金齿轮的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。