1.一种资产配置方法,其特征在于,包括:
获取目标用户的特征数据;
对所述特征数据进行预处理,以规范所述特征数据的数据格式;
将预处理后的特征数据输入至预先构建的强化学习网络模型,以通过所述强化学习网络模型获得针对所述目标用户的资产配置方案。
2.根据权利要求1所述的方法,其特征在于,所述特征数据包括下述至少一种:年龄、性别、学历、年收入、年支出、交易流水明细及对应的交易类别和持有产品。
3.根据权利要求1所述的方法,其特征在于,当所述特征数据包括性别以及学历时,所述对所述特征数据进行预处理,以规范所述特征数据的数据格式,包括:
分别对所述性别以及学历进行编码处理,以通过数值向量表示所述性别以及学历。
4.根据权利要求1-3任一项所述的方法,其特征在于,还包括:
获取样本用户的特征数据;
对所述样本用户的特征数据进行预处理,以规范所述样本用户的特征数据的数据格式,得到训练样本;
基于所述训练样本对设定强化学习网络进行训练,得到所述强化学习网络模型。
5.根据权利要求4所述的方法,其特征在于,对所述样本用户的特征数据进行预处理,包括:
对特征数据中的学历数据进行求众数处理,以利用求得的众数对缺失学历数据的样本用户的学历数据进行填充;
对特征数据中的年收入数据进行求平均值处理,以利用求得的平均值对年收入数据缺失的样本用户的年收入数据进行填充;
对特征数据中的年支出数据进行求平均值处理,以利用求得的平均值对年支出数据缺失的样本用户的年支出数据进行填充;
基于半监督学习算法对特征数据中的交易流水对应的类别进行确定。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述强化学习网络模型包括状态空间st=(s′t,kt)、动作集
其中,st表示t时刻所处的状态,s′t表示当前市场的关联信息,kt表示目标用户持有资产、年收入以及年支出,at表示t时刻进行资产配置的动作,rt表示在[t,t+1]时段内该资产配置方案的奖励值,pt表示收益或损失,ct表示交易费率,q(s,a)表示在状态s时,根据策略π,做出动作a所获得的γ折扣长期累计奖励,γ为奖励折扣。
7.一种资产配置装置,其特征在于,包括:
获取模块,用于获取目标用户的特征数据;
预处理模块,用于对所述特征数据进行预处理,以规范所述特征数据的数据格式;
配置模块,用于将预处理后的特征数据输入至预先构建的强化学习网络模型,以通过所述强化学习网络模型获得针对所述目标用户的资产配置方案。
8.根据权利要求7所述的装置,其特征在于,所述特征数据包括下述至少一种:年龄、性别、学历、年收入、年支出、交易流水明细及对应的交易类别和持有产品。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一项所述的资产配置方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-6中任一项所述的资产配置方法。