基于用户名的数据处理方法、装置、设备及介质与流程

文档序号:24307190发布日期:2021-03-17 01:00阅读:来源:国知局

技术特征:

1.一种基于用户名的数据处理方法,其特征在于,包括:

获取目标用户名信息;

从预设的名称向量库中,查找与所述目标用户名信息匹配的目标用户特征向量,所述名称向量库用于存储用户特征向量和所述用户特征向量对应的用户名信息;

将所述目标用户特征向量作为任务特征输入信息并进行数据处理,得到所述目标用户名信息对应的数据处理结果。

2.根据权利要求1所述的基于用户名的数据处理方法,其特征在于,所述获取用户名信息之前,还包括:

依据历史用户的消费视频数据,确定各视频属性对应的视频组;

针对每一个视频属性对应的视频组,依据所述视频组对应的用户名信息随机生成用户名序列;

通过预设的文本分类模型对所述用户名序列进行训练,得到所述用户名序列对应的用户特征向量;

将所述用户特征向量和所述用户特征向量对应的用户名信息存储至所述名称向量库。

3.根据权利要求2所述的基于用户名的数据处理方法,其特征在于,所述依据历史用户的消费视频数据,确定各视频属性信息对应的视频组,包括:

收集历史用户的消费视频数据;

从所述消费视频数据中提取出热门视频数据;

依据视频属性对所述热门视频数据进行划分,得到各视频属性对应的视频组,所述视频组包含至少一个热门视频数据。

4.根据权利要求3所述的基于用户名的数据处理方法,其特征在于,所述依据所述视频组对应的用户名信息随机生成用户名序列,包括:

基于同一视频组中各热门视频数据的用户名信息,生成用户名集合;

基于所述用户名集合中的用户名信息和预设的序列长度阈值,生成所述视频组对应的用户名序列。

5.根据权利要求4所述的基于用户名的数据处理方法,其特征在于,基于所述用户名集合中的用户名信息和预设的序列长度阈值,生成所述视频组对应的用户名序列,包括:

从所述用户名集合中随机挑选一个用户名信息,并将挑选到的用户名信息添加到新建名称序列中;

判断所述新建名称序列的序列长度是否达到预设的序列长度阈值;

若所述新建名称序列的序列长度没有达到所述序列长度阈值,则继续从所述用户名集合中随机挑选用户名信息并将挑选到的用户名信息添加到所述新建名称序列中,直到所述新建名称序列的序列长度达到所述序列长度阈值;

当所述新建名称序列的序列长度达到所述序列长度阈值,将所述新建名称序列确定为所述视频组对应的用户名序列。

6.根据权利要求5所述的基于用户名的数据处理方法,其特征在于,在将所述新建名称序列确定为所述视频组对应的用户名序列之后,还包括:

对所述视频组对应的用户名序列进行统计,得到所述视频组的用户名序列数量;

判断所述视频组的用户名序列数量是否达到预设的序列数量阈值;

若所述视频组的用户名序列数量没有达到所述序列数量阈值,则继续基于所述用户名集合中的用户名信息和预设的序列长度阈值,生成所述视频组对应的用户名序列。

7.根据权利要求4所述的基于用户名的数据处理方法,其特征在于,所述基于同一视频组中各热门视频数据的用户名信息,生成用户名集合,包括:

对同一视频组中各热门视频数据的用户名信息进行聚合,得到初始用户名集合,所述初始用户名集合包括至少一个视频用户名;

针对所述初始用户名集合中的每一个视频用户名,依据视频用户在所述同一视频组中的行为丰富度信息生成对应的用户名权重数据,所述视频用户为所述视频用户名对应的用户;

基于所述初始用户名集合和所述初始用户名中各视频用户名对应的用户名权重数据,生成所述视频组对应的用户名集合。

8.根据权利要求1所述的基于用户名的数据处理方法,其特征在于,所述从预设的名称向量库中,查找与所述目标用户名信息匹配的目标用户特征向量,包括:

依据所述目标用户名信息中的字符信息,确定目标名信息;

从所述名称向量库中查找与目标名信息相匹配的用户特征向量;

基于查找到的用户特征向量,确定所述目标用户特征向量。

9.根据权利要求8所述的基于用户名的数据处理方法,其特征在于,所述依据所述目标用户名信息中的字符信息,确定目标名信息,包括:

从所述目标用户名信息中提取符合预设字符格式的字符信息;

依据提取到的字符信息确定至少一个目标名信息。

10.根据权利要求9所述的基于用户名的数据处理方法,其特征在于,所述从所述名称向量库中查找与目标名信息相匹配的用户特征向量,包括:

针对每一个目标名信息,检测所述名称向量库中是否存在与所述目标名信息相同的用户名信息;

若所述名称向量库中存在与所述目标名信息相同的用户名信息,则从所述名称向量库中,提取相同的用户名信息对应的用户特征向量,以作为与所述目标名信息相匹配的用户特征向量。

11.根据权利要求1所述的基于用户名的数据处理方法,其特征在于,所述将所述目标用户特征向量作为任务特征输入信息并进行数据处理,得到所述目标用户名信息对应的数据处理结果,包括:

将所述目标用户特征向量作为任务特征输入信息,并传输给任务执行模块,其中,所述任务执行模块用于依据所述任务特征输入信息进行数据处理并产生结果信息;

将所述结果信息确定为所述目标用户名信息对应的数据处理结果。

12.一种基于用户名的数据处理装置,其特征在于,包括:

用户名信息获取模块,用于获取目标用户名信息;

用户特征向量匹配模块,用于从预设的名称向量库中,查找与所述目标用户名信息匹配的目标用户特征向量,所述名称向量库用于存储用户特征向量和所述用户特征向量对应的用户名信息;

数据处理模块,用于将所述目标用户特征向量作为任务特征输入信息并进行数据处理,得到所述目标用户名信息对应的数据处理结果。

13.一种基于用户名的数据处理设备,其特征在于,包括:处理器和存储器;

所述存储器中存储有至少一条指令,所述指令由所述处理器执行,使得所述基于用户名的数据处理设备执行如权利要求1至12任一所述的基于用户名的数据处理方法。

14.一种计算机可读存储介质,其特征在于,所述可读存储介质中的指令由终端设备的处理器执行时,使得终端设备能够执行如权利要求1至12任一所述的基于用户名的数据处理方法。


技术总结
本发明实施例公开了一种基于用户名的数据处理方法、装置、设备及介质,涉及计算机技术领域,该基于用户名的数据处理方法包括:获取目标用户名信息;从预设的名称向量库中,查找与所述目标用户名信息匹配的目标用户特征向量,所述名称向量库用于存储用户特征向量和所述用户特征向量对应的用户名信息;将所述目标用户特征向量作为任务特征输入信息并进行数据处理,得到所述目标用户名信息对应的数据处理结果。本发明实施解决了现有技术中在用户不填写诸如年龄、性别等敏感信息时无法实现新用户冷启的问题,提高数据挖掘的准确性。

技术研发人员:陶日明
受保护的技术使用者:百果园技术(新加坡)有限公司
技术研发日:2020.11.30
技术公布日:2021.03.16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1