基于Embedding技术的无监督关键词提取方法与流程

文档序号:20030068发布日期:2020-02-28 10:16阅读:来源:国知局
技术总结
本发明提供一种基于Embedding技术的无监督关键词提取方法,该方法利用图卷积词嵌入技术得到文章单词的语义兼句法词向量;利用Node2Vec技术训练单词的共现关系拓扑图,从而得到共现特征词向量;利用主题词嵌入技术,得到文章单词的主题词向量;将单词的三种特征向量拼接得到混合词向量,利用混合词向量计算单词间的余弦相似度去构造单词拓扑图,使用PageRank图迭代算法得到单词的重要性分数。该方法运用多种词嵌入技术,综合了单词间的语义、句法、共现以及主题多种关联特征,使得提取效果得到大大的提升。

技术研发人员:张兴宇;潘炎;印鉴
受保护的技术使用者:中山大学
技术研发日:2019.11.14
技术公布日:2020.02.28

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1