一种基于有监督主题模型的文本分类方法及系统与流程

文档序号:17000162发布日期:2019-03-02 01:43阅读:来源:国知局

技术特征:

技术总结
本公开提供了一种基于有监督主题模型的文本分类方法及系统。其中,一种基于有监督主题模型的文本分类方法,包括:构建SLDA‑TC文本分类模型;在训练SLDA‑TC文本分类模型的过程中,按照SLDA‑TC‑Gibbs算法对每个词的隐含主题进行采样,且只从与该词所在文本类别标签相同的其它训练文本中进行隐含主题采样;在确定每个词的隐含主题之后,通过统计频次,计算得到文本‑主题概率分布、主题‑词概率分布和主题‑类别概率分布;建立主题与类别之间的准确映射;将待测文本输入至训练生成的SLDA‑TC文本分类模型,推断出待测文本的主题,进而预测文本的类别。

技术研发人员:唐焕玲;窦全胜;于立萍;宋英杰;鲁眀羽
受保护的技术使用者:山东工商学院
技术研发日:2018.11.22
技术公布日:2019.03.01
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1