属性和评级共提取的制作方法

文档序号:38884788发布日期:2024-08-02 02:57阅读:17来源:国知局
属性和评级共提取的制作方法

本公开的实施例大体上涉及计算机技术,更具体地涉及信息共提取。


背景技术:

1、随着互联网的快速发展,越来越多的用户习惯于在互联网上评论诸如书籍和电影等实体。用户可以对同一实体的不同属性给与不同的关注,并且不同地评估同一实体的同一属性。这种评论中所包含的信息的提取对于构建对应实体的知识图并且更好地理解该实体可能是有益的。


技术实现思路

1、本公开的实施例提供了一种用于属性和评级共提取的解决方案。

2、在第一方面中,提出了一种用于属性和评级共提取的方法。该方法包括:由模型的第一子网,基于包含在文本中的第一词元(token)来确定第一特征表示,该第一特征表示指示第一词元在文本中的语义信息;由模型的第二子网,基于第一特征表示来确定与第一词元相关联的第一属性信息,该第一属性信息指示文本中所涉及的第一属性;以及由模型的第三子网,基于第一特征表示来确定与第一词元相关联的第一评级信息,该第一评级信息指示与第一属性相关的评级。根据本公开的第一方面的方法使得可以同时提取属性信息和评级信息。与常规的解决方案相比,所提出的方法可以有利地更有效地提取信息。

3、在第二方面中,提出了一种系统。该系统包括:至少一个处理器;以及至少一个存储器,通信地耦合到至少一个处理器并且包括计算机可读指令,在由至少一个处理器执行时,该计算机可读指令使至少一个处理器执行根据本公开的第一方面的方法。

4、在第三方面中,提出了一种非瞬态计算机可读存储介质。非瞬态计算机可读存储介质存储计算机可读指令,在由计算设备执行时,该计算机可读指令使计算设备执行根据本公开的第一方面的方法。

5、提供该
技术实现要素:
来以简化的形式介绍对于下面在具体实施方式中进一步描述的概念的选择。该发明内容不旨在标识要求保护的主题的关键特征或者必要特征,也不旨在被用于限制要求保护的主题的范围。



技术特征:

1.一种方法,包括:

2.根据权利要求1所述的方法,其中所述文本还包括所述第一词元之后的第二词元,

3.根据权利要求2所述的方法,其中所述第二词元对应于所述文本中的最后一个词元,所述模型还包括第四子网,

4.根据权利要求2所述的方法,还包括:

5.根据权利要求1所述的方法,其中确定所述第一特征表示包括:

6.根据权利要求5所述的方法,其中所述嵌入由语言模型预训练。

7.根据权利要求1所述的方法,其中所述第一子网包括长短期记忆(lstm)单元或者来自变换器的双向编码器表示(bert)单元。

8.一种系统,包括:

9.根据权利要求8所述的系统,其中所述文本还包括所述第一词元之后的第二词元,

10.根据权利要求9所述的方法,其中所述第二词元对应于所述文本中的最后一个词元,所述模型还包括第四子网,

11.根据权利要求9所述的系统,其中所述动作还包括:

12.根据权利要求8所述的系统,其中确定所述第一特征表示包括:

13.根据权利要求12所述的系统,其中所述嵌入由语言模型预训练。

14.根据权利要求8所述的系统,其中所述第一子网包括长短期记忆(lstm)单元或者来自变换器的双向编码器表示(bert)单元。

15.一种非瞬态计算机可读存储介质,存储计算机可读指令,所述计算机可读指令在由计算设备执行时使所述计算设备执行动作,所述动作包括:

16.根据权利要求15所述的非瞬态计算机可读存储介质,其中所述文本还包括所述第一词元之后的第二词元,

17.根据权利要求16所述的非瞬态计算机可读存储介质,其中所述第二词元对应于所述文本中的最后一个词元,所述模型还包括第四子网,

18.根据权利要求17所述的非瞬态计算机可读存储介质,其中所述动作还包括:

19.根据权利要求15所述的非瞬态计算机可读存储介质,其中确定所述第一特征表示包括:

20.根据权利要求19所述的非瞬态计算机可读存储介质,其中所述嵌入由语言模型预训练。


技术总结
本公开的实施例涉及属性和评级共提取。根据本公开的实施例,提出了一种方法。该方法包括:由模型的第一子网,基于包含在文本中的第一词元来确定第一特征表示,第一特征表示指示第一词元在文本中的语义信息;由模型的第二子网,基于第一特征表示来确定与第一词元相关联的第一属性信息,第一属性信息指示文本中所涉及的第一属性;以及由模型的第三子网,基于第一特征表示来确定与第一词元相关联的第一评级信息,第一评级信息指示与第一属性相关的评级。

技术研发人员:熊泓宇,汪罕,冯一琦,厉锐,高远,曾翔宇,鹿青怡,刘宾
受保护的技术使用者:脸萌有限公司
技术研发日:
技术公布日:2024/8/1
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1