数据存储方法和装置与流程

文档序号:11155638阅读:来源:国知局

技术特征:

1.一种数据存储方法,其特征在于,所述方法包括:

获取待存储的数据的特征信息,所述特征信息包括以下至少一项:所述数据所属的数据表中的数据表项的名称、指示所述数据的统计特征的统计特征信息、关键词;

将所述特征信息转换为数据分类模型的输入向量输入到数据分类模型,得到指示所述数据的类型的输出向量,所述数据分类模型基于预先利用训练样本以有监督方式进行训练而生成,所述训练样本包括:已存储数据的所述特征信息、经标注的所述已存储数据的类型;

将所述数据存储在所述类型对应的存储区域。

2.根据权利要求1所述的方法,其特征在于,所述数据分类模型为决策树模型。

3.根据权利要求2所述的方法,其特征在于,所述数据为数据表中的数据,所述特征信息包括:所述数据所属的数据表中的数据表项的名称、统计特征信息;以及

将所述特征信息转换为数据分类模型的输入向量输入到数据分类模型,得到指示所述数据的类型的输出向量包括:

生成特征信息对应的数据表特征向量,所述数据表特征向量包括:表示所述数据所属的数据表中的数据表项的名称的分量、表示统计特征信息的分量;

生成依次包含所述数据表特征向量和零向量的数据分类模型的第一输入向量;

将所述第一输入向量输入到数据分类模型,得到指示所述数据的类型的输出向量。

4.根据权利要求3所述的方法,其特征在于,所述统计特征信息包括:指示所述数据表项之间的关联关系的关联信息、所述数据的长度的平均值、所述数据的长度的最大值、所述数据的长度的最小值、所述数据中的字符的类型。

5.根据权利要求2所述的方法,其特征在于,所述数据为文本数据,所述特征信息为关键词;以及

将所述特征信息转换为数据分类模型的输入向量输入到数据分类模型,得到指示所述数据的类型的输出向量包括:

生成特征信息对应的关键词特征向量,其中,关键词特征向量中每一个关键词对应一个分量;

生成依次包含零向量和所述关键词特征向量的数据分类模型的第二输入向量;

将所述第二输入向量输入到数据分类模型,得到指示所述数据的类型的输出向量。

6.一种数据存储装置,其特征在于,所述装置包括:

获取单元,配置用于获取待存储的数据的特征信息,所述特征信息包括以下至少一项:所述数据所属的数据表中的数据表项的名称、指示所述数据的统计特征的统计特征信息、关键词;

输入单元,配置用于将所述特征信息转换为数据分类模型的输入向量输入到数据分类模型,得到指示所述数据的类型的输出向量,所述数据分类模型基于预先利用训练样本以有监督方式进行训练而生成,所述训练样本包括:已存储数据的所述特征信息、经标注的所述已存储数据的类型;

存储单元,配置用于将所述数据存储在所述类型对应的存储区域。

7.根据权利要求5所述的装置,其特征在于,所述数据分类模型为决策树模型。

8.根据权利要求7所述的装置,其特征在于,所述数据为数据表中的数据,所述特征信息包括:所述数据所属的数据表中的数据表项的名称、统计特征信息,以及所述输入单元包括:

数据表特征向量生成子单元,配置用于生成特征信息对应的数据表特征向量,所述数据表特征向量包括:表示所述数据所属的数据表中的数据表项的名称的分量、表示统计特征信息的分量;

第一输入向量生成子单元,配置用于生成依次包含所述数据表特征向量和零向量的数据分类模型的第一输入向量;

输出向量生成子单元,配置用于将所述第一输入向量输入到数据分类模型,得到指示所述数据的类型的输出向量。

9.根据权利要求8所述的装置,其特征在于,所述统计特征信息包括:指示所述数据表项之间的关联关系的关联信息、所述数据的长度的平均值、所述数据的长度的最大值、所述数据的长度的最小值、所述数据中的字符的类型。

10.根据权利要求7所述的装置,其特征在于,所述数据为文本数据,所述特征信息为关键词,以及所述输入单元包括:

关键词特征向量生成子单元,配置用于生成特征信息对应的关键词特征向量,其中,关键词特征向量中每一个关键词对应一个分量;

第二输入向量生成子单元,配置用于生成依次包含零向量和所述关键词特征向量的数据分类模型的第二输入向量;

输出向量生成子单元,配置用于将所述第二输入向量输入到数据分类模型,得到指示所述数据的类型的输出向量。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1