一种数据标签生成方法和装置与流程

文档序号:12305420阅读:来源:国知局

技术特征:

技术总结
本发明公开了一种数据标签生成方法和装置,涉及互联网数据领域。本发明方法包括:获取原始文本数据;利用顶层主题数据库分析得到多个顶层主题文本数据;预处理顶层主题文本数据得到顶层主题预处理文本数据;提取顶层主题预处理文本数据中所有文档Tf‑idf特征值得到矩阵数据;对矩阵数据进行主题聚类得到多个不同主题聚类;从每个主题聚类中关键词并由高至低排序;根据实际应用对关键词排序表进行校正,留取与对应的主题聚类内容相关度密切且正确表达对应主题聚类内容的关键词;根据新关键词排序表得到各主题聚类的标签。本发明方法可快速高效对海量数据进行主题聚类,所得标签体系结构完整、内容丰富以、更贴近实际应用以便于用户使用。

技术研发人员:李晖;胡宁杭;郑悦
受保护的技术使用者:北京融数云途科技有限公司
技术研发日:2017.05.17
技术公布日:2017.10.27
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1