一种文本分类方法与流程

文档序号:15386060发布日期:2018-09-08 00:34阅读:来源:国知局

技术特征:

技术总结
本发明提供了一种文本分类方法,属于文本分类领域,具体包括如下步骤:从文件库选取若干篇文章筛选出文本的指标集,并将指标集进行归类划分为不同的指标库。对指标库进行归一化处理得到文本分类指标矩阵。选取需分类的文本,对文本进行预处理,提取特征词,对文本进行分词和分字处理,去除中性词。计算特征词的权重值;根据权重值选取本分类指标矩阵对词和字进行文本分类处理,完成文本分类。本发明通过根据现有已经分类的文本进行筛选指标集,并根据指标集进行划分指标库,同时计算指标库的在不同文本中权重值,再进行列出分类矩阵,从而使得分类模型更加准确更加好,同时在前期通过人为的判断进行更新指标库。

技术研发人员:韦灵;倪志平;黎伟强;崔亚楠;胡艳华
受保护的技术使用者:广西科技大学鹿山学院
技术研发日:2018.03.22
技术公布日:2018.09.07
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1