技术特征:
技术总结
本发明涉及一种基于SAO结构的中文专利文本实体关系抽取方法,包括:步骤一:从专利文本中获取候选SAO三元组;步骤二:提取候选SAO三元组的传统特征和句法语义特征。本发明提供的基于SAO结构的中文专利文本实体关系抽取方法,把中文专利文本的关系抽取问题,转化为SAO结构识别的分类问题,利用中文专利语料作为处理数据,抽取了词法特征、上下文特征、距离特征以及句法语义特征,能够显著地增强关系抽取的性能,能够有效地提升关系抽取的效果,可以很好地满足实际应用的需要。
技术研发人员:吕学强;董志安
受保护的技术使用者:北京信息科技大学
技术研发日:2018.10.16
技术公布日:2019.06.25