包含松散结构的汉语多词表达敏感特征的抽取方法与流程

文档序号:13642738阅读:来源:国知局
技术总结
本发明公开了一种包含松散结构的汉语多词表达敏感特征的抽取方法,其步骤如下:1)、紧凑结构多词表达的敏感特征集,只要某个特征能提升该多词表达抽取的结果,就认为它是该多词表达的特征集,特征集用表示;2)、松散结构多词表达的敏感特征集,将采用统计信息和人工总结的词表、规则、模版以及语义特征相结合的多种特征作为松散结构的特征集,特征集用表示;3)、敏感特征选择算法,敏感特征选择是从所有特征中选择出一组最有效、对分类效果影响最大的特征子集。通过上述方式,本发明能够采用统计信息和人工总结的词表、规则、模版以及语义特征相结合的多种特征结合的策略,进而得到适合不同结构的敏感特征集,提高计算效率和降低复杂性。

技术研发人员:梁颖红
受保护的技术使用者:苏州市职业大学
文档号码:201310206429
技术研发日:2013.05.29
技术公布日:2018.02.09

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1