技术特征:
技术总结
本发明公开了一种基于位置信息的贝叶斯文本分类方法,所述方法包括:S1、对词袋模型通过输入转换模块进行转换,所述输入转换模块内设置有位置函数以对词袋模型的位置参数进行转换;S2、将数据转换的结果通过学习模块进行训练,得到关于位置参数的不同测试结果,选取测试效果最佳的参数模型,所述学习模块内设置有MNB贝叶斯模型;S3、利用已训练的模型对新入文本语料进行情感类别预测;本发明通过设置一种基于位置信息的权重计算方法,在不影响模型速度的前提下获得了更好的效果,这对于避免文本中特征词语之间的独立性假设提供了一种合理的方法。
技术研发人员:金勇
受保护的技术使用者:武汉烽火普天信息技术有限公司
技术研发日:2019.03.14
技术公布日:2019.06.28