技术总结
本发明提供一种多任务命名实体识别训练方法,方法包括:获取待识别训练文本;对所述待识别训练文本进行标注,预先定义实体序列标志和用于表示不同实体类别的实体类型,并获取二者之间的映射关系;在训练时,将实体识别任务分解为第一阶段任务和第二阶段任务;通过获取实体类型对应的实体的特征向量表示,将所述实体识别任务为一个多分类任务,所述进行多任务命名实体识别训练;本发明通过将实体识别任务分解为两阶段的子任务,第一阶段任务专注于识别文本中的实体,第二阶段任务则判断实体的类型,利用第一阶段识别到的实体,获取其对应的实体的特征向量表示,通过任务分解,当实体类别较多时能大幅度降低分类数量,提高了模型的最终的识别精度。最终的识别精度。最终的识别精度。
技术研发人员:熊永福
受保护的技术使用者:重庆紫光华山智安科技有限公司
技术研发日:2020.10.29
技术公布日:2021/1/24