一种改进的中文自动分词算法的制作方法

文档序号:11063459阅读:来源:国知局
技术总结
一种改进的中文自动分词算法,将待分词句子和已经初始化成功的语料库中的词进行对比匹配,根据概率统计学,将待分词句子拆分为网状结构,将网状结构的每条边都赋予一定的权值,其中权值最大的路径便是最终的分词结果,最后将验证分词结果的准确率和召回率。本发明中中文预处理的速度较基于分词词典的方法快;较基于分词词典的方法精度更高;较基于统计学方法有更好的准确度;实用性更大,更符合经验值;为后续自然语言处理技术提供了极大的应用价值。

技术研发人员:金平艳;胡成华
受保护的技术使用者:四川用联信息技术有限公司
文档号码:201610814785
技术研发日:2016.09.12
技术公布日:2017.05.03

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1