车辆信息抽取方法、装置、存储介质及电子设备与流程

文档序号:35525979发布日期:2023-09-21 03:22阅读:26来源:国知局
车辆信息抽取方法、装置、存储介质及电子设备与流程

本发明涉及车联网领域,具体而言,涉及一种车辆信息抽取方法、装置、存储介质及电子设备。


背景技术:

1、智能语音服务与智能推荐服务作为智能网联汽车的重要功能近些年取得了突破性的进步与发展,其体验力提升的最重要的部分之一即为车辆知识的积累与抽取。目前大部分主机厂的知识抽取方式主要为:对于重要的、必要的信息通过人工手动增加三元组,而其他部分信息通过搭建信息抽取模型进行自动化信息抽取。但是人工搭建信息抽取模型的时间较长,且训练数据均需要人工标注,当人工手动增加三元组出错或者训练数据较大时容易出现信息抽取模型训练出错的情况,进而会导致对知识抽取的准确率低。

2、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本发明实施例提供了一种车辆信息抽取方法、装置、存储介质及电子设备,以至少解决相关技术中对车辆信息抽取的准确率低的技术问题。

2、根据本发明实施例的一个方面,提供了一种车辆信息抽取方法,包括:获取从互联网上爬取到的第一车辆信息;将第一车辆信息与预设车辆信息进行语义匹配,得到第一车辆信息的语义匹配结果,其中,语义匹配结果用于表征第一车辆信息与预设车辆信息是否语义相同或语义相反,预设车辆信息是车辆相关的手册中提取出的信息;响应于语义匹配结果为第一车辆信息与预设车辆信息语义不相同且语义不相反,基于预设规则对第一车辆信息进行信息抽取,得到第一车辆信息对应的第一三元组信息。

3、可选地,将第一车辆信息与预设车辆信息进行语义匹配,得到第一车辆信息的语义匹配结果,包括:利用预先训练好的语义分类模型对第一车辆信息与预设车辆信息进行语义匹配,得到第一匹配概率,其中,第一匹配概率用于表征第一车辆信息与预设车辆信息语义相同的概率;响应于第一匹配概率大于或等于第一预设概率,确定语义匹配结果为第一车辆信息与预设车辆信息语义相同;响应于第一匹配概率小于第二预设概率,确定语义匹配结果为第一车辆信息与预设车辆信息语义相反,第一预设概率大于第二预设概率;响应于第一匹配概率小于第一预设概率,且大于或等于第二预设概率,确定语义匹配结果为第一车辆信息与预设车辆信息语义不相同且语义不相反。

4、可选地,该方法还包括:获取从车辆的设计文档中提取出第二车辆信息;接收预设车辆信息与第二车辆信息的匹配概率标注结果;利用预设车辆信息、第二车辆信息和匹配概率标注结果对预设分类模型进行训练,得到语义分类模型。

5、可选地,基于预设规则对第一车辆信息进行信息抽取,得到第一车辆信息对应的第一三元组信息,包括:利用预先训练好的信息抽取模型对第一车辆信息进行信息抽取,得到第一三元组信息,其中,信息抽取模型是利用预设规则、预设车辆信息和第二车辆信息训练得到的。

6、可选地,该方法还包括:利用预设规则对预设车辆信息进行规则匹配,生成预设车辆信息对应的预设三元组信息;利用预先训练好的语义分类模型对第二车辆信息与预设车辆信息进行语义匹配,确定与预设车辆信息语义相同的目标车辆信息;利用初始抽取模型对目标车辆信息进行信息抽取,得到目标车辆信息对应的第二三元组信息;基于预设三元组信息和第二三元组信息对初始抽取模型的模型参数进行调整,得到信息抽取模型。

7、可选地,利用预设规则对预设车辆信息进行规则匹配,生成预设车辆信息对应的预设三元组信息,包括:利用预设规则中的匹配规则对预设车辆信息进行规则匹配,得到第一匹配结果,其中,预设规则至少包括:动词匹配规则、控制器匹配规则和名词匹配规则;利用预设规则中的正则规则将第一匹配结果进行组装,得到预设三元组信息。

8、可选地,在基于预设规则对第一车辆信息进行信息抽取,得到第一车辆信息对应的第一三元组信息之后,该方法还包括:将第一三元组信息存储至目标数据库,其中,目标数据库中存储有预设车辆信息对应的预设三元组信息。

9、根据本发明实施例的另一方面,还提供了一种车辆信息抽取装置,包括:获取模块,用于获取从互联网上爬取到的第一车辆信息;匹配模块,用于将第一车辆信息与预设车辆信息进行语义匹配,得到第一车辆信息的语义匹配结果,其中,语义匹配结果用于表征第一车辆信息与预设车辆信息是否语义相同或语义相反,预设车辆信息是车辆相关的手册中提取出的信息;抽取模块,用于响应于语义匹配结果为第一车辆信息与预设车辆信息语义不相同且语义不相反,基于预设规则对第一车辆信息进行信息抽取,得到第一车辆信息对应的第一三元组信息。

10、根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述任意一项的方法。

11、根据本发明实施例的另一方面,还提供了一种电子设备,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述任意一项的方法。

12、在本发明实施例中,采用获取从互联网上爬取到的第一车辆信息;将第一车辆信息与预设车辆信息进行语义匹配,得到第一车辆信息的语义匹配结果;响应于语义匹配结果为第一车辆信息与预设车辆信息语义不相同且语义不相反,基于预设规则对第一车辆信息进行信息抽取,得到第一车辆信息对应的第一三元组信息的方式。容易注意到的是,将第一车辆信息与预设车辆信息进行语义匹配,解决了相关技术中人工标注容易出错的问题,进一步的,基于语义匹配结果,预设规则可以高效、准确、直接的对第一车辆信息进行抽取,达到了准确的对车辆信息进行抽取的目的,从而实现了提高对车辆信息抽取的准确率的技术效果,进而解决了相关技术中对车辆信息抽取的准确率低的技术问题。



技术特征:

1.一种车辆信息抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,将所述第一车辆信息与预设车辆信息进行语义匹配,得到所述第一车辆信息的语义匹配结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,基于预设规则对所述第一车辆信息进行信息抽取,得到所述第一车辆信息对应的第一三元组信息,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,利用所述预设规则对所述预设车辆信息进行规则匹配,生成所述预设车辆信息对应的预设三元组信息,包括:

7.根据权利要求1所述的方法,其特征在于,在基于预设规则对所述第一车辆信息进行信息抽取,得到所述第一车辆信息对应的第一三元组信息之后,所述方法还包括:

8.一种车辆信息抽取装置,其特征在于,包括:

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的方法。

10.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至7中任意一项所述的方法。


技术总结
本发明公开了一种车辆信息抽取方法、装置、存储介质及电子设备。其中,该方法应用于车联网领域,包括:获取从互联网上爬取到的第一车辆信息;将第一车辆信息与预设车辆信息进行语义匹配,得到第一车辆信息的语义匹配结果,其中,语义匹配结果用于表征第一车辆信息与预设车辆信息是否语义相同或语义相反,预设车辆信息是车辆相关的手册中提取出的信息;响应于语义匹配结果为第一车辆信息与预设车辆信息语义不相同且语义不相反,基于预设规则对第一车辆信息进行信息抽取,得到第一车辆信息对应的第一三元组信息。本发明解决了相关技术中对车辆信息抽取的准确率低的技术问题。

技术研发人员:杨杰,吕贵林,陈涛,姜大力,韩爽,王烁皓,葛凇志
受保护的技术使用者:中国第一汽车股份有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1