基于动态聚类的数据处理方法、介质、设备及装置与流程

文档序号:33037975发布日期:2023-01-24 20:33阅读:来源:国知局

技术特征:
1.一种基于动态聚类的数据处理方法,其特征在于,包括以下步骤:获取所有的待处理数据向量和第一阈值;根据所述第一阈值对所述所有的待处理数据向量进行划分,以得到多个第一数据集和每个第一数据集对应的中心向量;判断所述每个第一数据集对应的中心向量的个数是否大于所述第一阈值;如果是,则根据所述第一阈值对所述每个第一数据集对应的中心向量进行划分,以得到多个第二数据集和每个第二数据集对应的中心向量,以此类推,直至中心向量的个数小于等于所述第一阈值,以得到多个最终数据集和每个最终数据集对应的中心向量。2.如权利要求1所述的基于动态聚类的数据处理方法,其特征在于,如果所述每个第一数据集对应的中心向量的个数小于等于所述第一阈值,则将所述第一数据集作为最终数据集。3.如权利要求2所述的基于动态聚类的数据处理方法,其特征在于,还包括:获取与待推荐数据向量距离最近的中心向量,并找到所述距离最近的中心向量对应的最终数据集,以便根据所述最终数据集找到所述待处理数据向量中与所述待推荐数据向量最相似的数据向量。4.如权利要求1-3中任一项所述的基于动态聚类的数据处理方法,其特征在于,划分过程包括:将待拆分的数据集中距离最远的两个数据向量之间的1/4中心点作为第一初始中心,3/4中心点作为第二初始中心,以便根据所述第一初始中心和所述第二初始中心将所述待拆分的数据集拆分成两个数据集。5.一种计算机可读存储介质,其特征在于,其上存储有基于动态聚类的数据处理程序,该基于动态聚类的数据处理程序被处理器执行时实现如权利要求1-4中任一项所述的基于动态聚类的数据处理方法。6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1-4中任一项所述的基于动态聚类的数据处理方法。7.一种基于动态聚类的数据处理装置,其特征在于,包括:获取模块,用于获取所有的待处理数据向量和第一阈值;划分模块,用于根据第一阈值对所有的待处理数据向量进行划分,以得到多个第一数据集和每个第一数据集对应的中心向量;判断模块,用于判断每个第一数据集对应的中心向量的个数是否大于第一阈值;如果是,则通过所述划分模块根据第一阈值对每个第一数据集对应的中心向量进行划分,以得到多个第二数据集和每个第二数据集对应的中心向量,以此类推,直至中心向量的个数小于等于第一阈值,以得到多个最终数据集和每个最终数据集对应的中心向量。8.如权利要求7所述的基于动态聚类的数据处理装置,其特征在于,如果所述每个第一数据集对应的中心向量的个数小于等于所述第一阈值,则将所述第一数据集作为最终数据集。9.如权利要求7所述的基于动态聚类的数据处理装置,其特征在于,还包括筛选模块,用于获取与待推荐数据向量距离最近的中心向量,并找到所述距离最近的中心向量对应的
最终数据集,以便根据所述最终数据集找到所述待处理数据向量中与所述待推荐数据向量最相似的数据向量。10.如权利要求7-9中任一项所述的基于动态聚类的数据处理装置,其特征在于,所述划分模块还用于将待拆分的数据集中距离最远的两个数据向量之间的1/4中心点作为第一初始中心,3/4中心点作为第二初始中心,以便根据第一初始中心和第二初始中心将所述待拆分的数据集拆分成两个数据集。

技术总结
本发明公开了一种基于动态聚类的数据处理方法、介质、设备及装置,包括:获取所有的待处理数据向量和第一阈值;根据所述第一阈值对所述所有的待处理数据向量进行划分,以得到多个第一数据集和每个第一数据集对应的中心向量;判断所述每个第一数据集对应的中心向量的个数是否大于所述第一阈值;如果是,则根据所述第一阈值对所述每个第一数据集对应的中心向量进行划分,以得到多个第二数据集和每个第二数据集对应的中心向量,以此类推,直至中心向量的个数小于等于所述第一阈值,以得到多个最终数据集和每个最终数据集对应的中心向量,由此,能够不受纬度限制,且在海量数据下计算量小,从而大大提高了推荐速度。从而大大提高了推荐速度。从而大大提高了推荐速度。


技术研发人员:吴万健
受保护的技术使用者:稿定(厦门)信息服务有限公司
技术研发日:2022.10.26
技术公布日:2023/1/23
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1