一种中文句子的命名实体识别方法及装置

文档序号:24821401发布日期:2021-04-27 14:44阅读:来源:国知局

技术特征:
1.一种中文句子的命名实体识别方法,其特征在于,所述方法包括:将中文字符序列输入已训练的实体识别模型,以由本实体识别模型通过字符嵌入层将所述中文字符序列中的每个字符转换为字向量,并输出到本实体识别模型中的卷积网络,以由所述卷积网络对每个字向量进行卷积运算得到局部语义向量,并输出到本实体识别模型中的自适应结合层,以由所述自适应结合层对每个字符的局部语义向量进行注意力计算后与对应的字向量拼接得到表征向量,并输出到本实体识别模型中的序列建模网络,以由所述序列建模网络对每个字符的表征向量进行隐层建模,并将建模得到的隐层向量输出到本实体识别模型中的标签推理层计算每个字符的隐层向量对应的标签;获取所述实体识别模型输出的标签序列并作为命名实体识别结果。2.根据权利要求1所述的方法,其特征在于,字符嵌入层将所述中文字符序列中的每个字符转换为字向量,包括:针对所述中文字符序列中的每个字符,在已训练的字向量表中查找该字符对应的字向量。3.根据权利要求1所述的方法,其特征在于,所述卷积网络对每个字向量进行卷积运算得到局部语义向量,包括:针对每个字向量,通过本卷积网络中的第一卷积层对该字向量进行卷积运算,并输出给本卷积网络的第二卷积层;所述第二卷积层对第一卷积层得到的向量再进行卷积运算得到该字向量的局部语义向量。4.根据权利要求1所述的方法,其特征在于,所述自适应结合层对每个字符的局部语义向量进行注意力计算后与对应的字向量拼接得到表征向量,包括:接收本实体识别模型中潜在词嵌入层输出的每个字符对应的所有潜在词的词向量矩阵;针对每个字符,将该字符的局部语义向量与词向量矩阵进行注意力计算,并将注意力计算结果与该字符的字向量进行拼接得到该字符的表征向量。5.根据权利要求4所述的方法,其特征在于,所述潜在词嵌入层获取每个字符对应的所有潜在词的词向量矩阵,包括:将所述中文字符序列与预先构建的字典树进行匹配,以获得子字符串;将每个子字符串与已训练的词典进行匹配,以获取匹配成功的子字符串;将匹配成功的子字符串与其包含的字符进行关联,以得到每个字符的潜在词集合;针对每个字符,在词向量表中查询该字符的潜在词集合中每个潜在词的词向量以组成该字符的词向量矩阵。6.根据权利要求1所述的方法,其特征在于,所述序列建模网络对每个字符的表征向量进行隐层建模,包括:通过本序列建模网络中的前向长短时记忆网络对每个字符的表征向量进行隐层建模得到每个字符的前向隐层向量;通过本序列建模网络中的后向长短时记忆网络对每个字符的表征向量进行隐层建模得到每个字符的后向隐层向量;通过本序列建模网络中的拼接层对每个字符的前向隐层向量和后向隐层向量分别进
行拼接得到每个字符的隐层向量。7.一种中文句子的命名实体识别装置,其特征在于,所述装置包括:实体识别模块,用于将中文字符序列输入已训练的实体识别模型,以由本实体识别模型通过字符嵌入层将所述中文字符序列中的每个字符转换为字向量,并输出到本实体识别模型中的卷积网络,以由所述卷积网络对每个字向量进行卷积运算得到局部语义向量,并输出到本实体识别模型中的自适应结合层,以由所述自适应结合层对每个字符的局部语义向量进行注意力计算后与对应的字向量拼接得到表征向量,并输出到本实体识别模型中的序列建模网络,以由所述序列建模网络对每个字符的表征向量进行隐层建模,并将建模得到的隐层向量输出到本实体识别模型中的标签推理层计算每个字符的隐层向量对应的标签;获取模块,用于获取所述实体识别模型输出的标签序列并作为命名实体识别结果。8.根据权利要求7所述的装置,其特征在于,所述获取模块,具体用于在字符嵌入层将所述中文字符序列中的每个字符转换为字向量过程中,针对所述中文字符序列中的每个字符,在已训练的字向量表中查找该字符对应的字向量。9.一种电子设备,其特征在于,包括可读存储介质和处理器;其中,所述可读存储介质,用于存储机器可执行指令;所述处理器,用于读取所述可读存储介质上的所述机器可执行指令,并执行所述指令以实现权利要求1

6任一项所述方法的步骤。10.一种芯片,其特征在于,包括可读存储介质和处理器;其中,所述可读存储介质,用于存储机器可执行指令;所述处理器,用于读取所述可读存储介质上的所述机器可执行指令,并执行所述指令以实现权利要求1

6任一项所述方法的步骤。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1