1.一种基于大数据的表单处理方法,其特征在于,所述方法包括:
获取第一表单数据,根据第一表单结构将所述第一表单数据生成第一表单页面,所述第一表单页面包括第一表单属性信息,所述第一表单属性信息包括第一存储时长;
备份所述第一表单页面,将所述第一表单页面存储至大数据库;
在所述第一表单页面的存储时长达到所述第一存储时长时,从所述第一表单数据中筛选部分表单数据,得到第二表单数据;
根据第二表单结构将所述第二表单数据生成第二表单页面,所述第一表单结构的第一结构复杂度大于所述第二表单结构的第二结构复杂度;
备份所述第二表单页面,将所述大数据库中已备份的所述第一表单页面更新为所述第二表单页面。
2.根据权利要求1所述的方法,其特征在于,所述第一表单数据包括多个表单内容,所述根据第一表单结构将所述第一表单数据生成第一表单页面,包括:
根据所述第一表单结构创建表单;
通过所述表单获取所述多个表单内容对应的多个配置参数;
根据所述多个配置参数和所述多个表单内容生成表单内容组件,得到多个表单内容组件;
对所述多个表单内容组件进行渲染,得到所述第一表单页面。
3.根据权利要求2所述的方法,其特征在于,所述表单包括多个表单控件,所述通过所述表单获取所述多个表单内容对应的多个配置参数,包括:
接收用户针对所述多个表单控件的编辑指令,所述编辑指令携带所述多个配置参数;
从所述编辑指令中提取所述多个配置参数。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述多个表单内容包括必填项表单内容和可选填项表单内容,所述从所述第一表单数据中筛选部分表单数据,得到第二表单数据,包括:
确定多个表单内容中内容缺省的可选填项表单内容,以及非内容缺省的可选填项表单内容;
将所述内容缺省的可选填项表单内容,以及所述非内容缺省的可选填项表单内容中不满足预设规则的可选填项表单内容进行剔除,得到所述第二表单数据。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
确定非内容缺省的任一可选填项表单内容的内容真实度以及有效存续时长;
若所述内容真实度低于预设真实度阈值,且所述有效存续时长小于或等于所述第一存储时长,则确定所述非内容缺省的可选填项表单内容中不满足预设规则。
6.根据权利要求5所述的方法,其特征在于,所述确定非内容缺省的任一可选填项表单内容的内容真实度,包括:
获取所述任一可选填项表单内容的数据来源信息;
对所述数据来源信息进行特征提取,得到数据来源特征集,所述数据来源特征集包括多个数据来源特征,且所述多个数据来源特征对应不同的多个优先级;
按照优先级从高到低的顺序对所述多个数据来源特征依次进行内容真实度计算,并累计已经计算的内容真实度;
所述方法还包括:
当所述内容真实度大于或等于所述预设真实度阈值时,停止进行内容真实度计算,将所述任一可选填项表单内容纳入所述第二表单数据。
7.根据权利要求5或6所述的方法,其特征在于,所述方法还包括:
获取至少一个存储时长评估指标,所述存储时长评估指标包括以下至少一种:表单数据的时效性等级、有效存续时长、效益转化率;
确定所述至少一个存储时长评估指标对应的评估值,得到至少一个评估值;
根据所述至少一个评估值和所述至少一个存储时长评估指标对应的至少一个权值进行加权计算,得到目标评估值;
根据预设的评估值与存储时长之间的映射关系确定与所述目标评估值对应的第一存储时长。
8.一种基于大数据的表单处理装置,其特征在于,所述装置包括:
获取单元,用于获取第一表单数据;
处理单元,用于根据第一表单结构将所述第一表单数据生成第一表单页面,所述第一表单页面包括第一表单属性信息,所述第一表单属性信息包括第一存储时长;
备份单元,用于备份所述第一表单页面,将所述第一表单页面存储至大数据库;
筛选单元,用于在所述第一表单页面的存储时长达到所述第一存储时长时,从所述第一表单数据中筛选部分表单数据,得到第二表单数据;
所述处理单元,还用于根据第二表单结构将所述第二表单数据生成第二表单页面,所述第一表单结构的第一结构复杂度大于所述第二表单结构的第二结构复杂度;
所述备份单元,还用于备份所述第二表单页面,将所述大数据库中已备份的所述第一表单页面更新为所述第二表单页面。
9.一种基于大数据的表单处理装置,其特征在于,包括处理器、存储器和通信接口,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被处理器执行,以实现如权利要求1-7任一项所述的方法。