媒体信息的标签识别方法、装置和存储介质及电子设备与流程

文档序号:37120087发布日期:2024-02-22 21:23阅读:16来源:国知局
媒体信息的标签识别方法、装置和存储介质及电子设备与流程

本技术涉及计算机领域,具体而言,涉及一种媒体信息的标签识别方法、装置和存储介质及电子设备。


背景技术:

1、在媒体信息的标签识别场景中,通常会标注大量样本数据,并训练模型,再用模型给新的媒体信息打标签,如需要人工收集大量的媒体信息,再对收集到的媒体信息采取人工标注,为媒体信息打上对应的标签。

2、但上述方式需要收集充足的样本数据,对于人力成本和时间成本都有较大消耗,进而导致媒体信息的标签识别效率较低的问题出现。因此,存在媒体信息的标签识别效率较低的问题。

3、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本技术实施例提供了一种媒体信息的标签识别方法、装置和存储介质及电子设备,以至少解决媒体信息的标签识别效率较低的技术问题。

2、根据本技术实施例的一个方面,提供了一种媒体信息的标签识别方法,包括:获取属于第一媒体标签的至少两个第一样本信息,和属于第二媒体标签的至少两个第二样本信息;利用上述至少两个第一样本信息获取上述第一媒体标签的第一标签表示,和利用上述至少两个第二样本信息获取上述第二媒体标签的第二标签表示,其中,上述第一标签表示用于表征属于上述第一媒体标签的信息内容,上述第二标签表示用于表征属于上述第二媒体标签的信息内容;响应于对待识别媒体信息触发的标签识别请求,获取上述待识别媒体信息与上述第一标签表示之间的第一信息相似度,和获取上述待识别媒体信息与上述第二标签表示之间的第二信息相似度,其中,上述标签识别请求用于请求确定上述待识别媒体信息属于的媒体标签;在上述第一信息相似度大于上述第二信息相似度的情况下,将上述第一媒体标签确定为上述待识别媒体信息属于的媒体标签;在上述第一信息相似度小于上述第二信息相似度的情况下,将上述第二媒体标签确定为上述待识别媒体信息属于的媒体标签。

3、根据本技术实施例的另一方面,还提供了一种媒体信息的标签识别装置,包括:第一获取单元,用于获取属于第一媒体标签的至少两个第一样本信息,和属于第二媒体标签的至少两个第二样本信息;第二获取单元,用于利用上述至少两个第一样本信息获取上述第一媒体标签的第一标签表示,和利用上述至少两个第二样本信息获取上述第二媒体标签的第二标签表示,其中,上述第一标签表示用于表征属于上述第一媒体标签的信息内容,上述第二标签表示用于表征属于上述第二媒体标签的信息内容;第三获取单元,用于响应于对待识别媒体信息触发的标签识别请求,获取上述待识别媒体信息与上述第一标签表示之间的第一信息相似度,和获取上述待识别媒体信息与上述第二标签表示之间的第二信息相似度,其中,上述标签识别请求用于请求确定上述待识别媒体信息属于的媒体标签;第一确定单元,用于在上述第一信息相似度大于上述第二信息相似度的情况下,将上述第一媒体标签确定为上述待识别媒体信息属于的媒体标签;第二确定单元,用于在上述第一信息相似度小于上述第二信息相似度的情况下,将上述第二媒体标签确定为上述待识别媒体信息属于的媒体标签。

4、作为一种可选的方案,上述第二获取单元,包括:第一提取模块,用于对上述至少两个第一样本信息进行特征提取,得到第一信息特征,其中,上述第一标签表示包括上述第一信息特征;和,第二提取模块,用于对上述至少两个第二样本信息进行特征提取,得到第二信息特征,其中,上述第二标签表示包括上述第二信息特征;上述第三获取单元,包括:第一获取模块,用于获取上述待识别媒体信息对应的媒体信息特征和上述第一信息特征之间的第一特征相似度,其中,上述媒体信息特征用于表征上述待识别媒体信息的信息内容,上述第一信息相似度包括上述第一特征相似度;和,第二获取模块,用于获取上述媒体信息特征和上述第二信息特征之间的第二特征相似度,其中,上述第二信息相似度包括上述第二特征相似度。

5、作为一种可选的方案,上述第一提取模块,包括:第一提起子模块,用于对上述至少两个第一样本信息进行多模态的特征提取,得到属于第一模态的第一子特征,和属于第二模态的第二子特征,其中,上述第一样本信息包含属于上述第一模态的第一子信息,和属于上述第二模态的第二子信息,上述第一子特征用于表征上述第一子信息的信息内容,上述第二子特征用于表征上述第二子信息的信息内容;第一融合子模块,用于对上述第一子特征和上述第二子特征进行特征融合,得到上述第一信息特征;上述第二提取模块,包括:第二提起子模块,用于对上述至少两个第二样本信息进行多模态的特征提取,得到属于上述第一模态的第三子特征,和属于上述第二模态的第四子特征,其中,上述第二样本信息包含属于上述第一模态的第三子信息,和属于上述第二模态的第四子信息,上述第三子特征用于表征上述第三子信息的信息内容,上述第四子特征用于表征上述第四子信息的信息内容;第二融合子模块,用于对上述第三子特征和上述第四子特征进行特征融合,得到上述第二信息特征。

6、作为一种可选的方案,上述第一提起子模块,包括:第一变量子单元,用于将上述第一子信息表示为特征维度的第一变量,和将上述第二子信息表示为上述特征维度的第二变量,其中,上述第一子特征包括上述第一变量,上述第二子特征包括上述第二变量;上述第一融合子模块,包括:第一平均子单元,用于将相同上述特征维度的上述第一变量和上述第二变量进行第一平均处理,并将上述第一平均处理得到的结果,作为上述第一信息特征;上述第二提起子模块,包括:第二变量子单元,用于将上述第三子信息表示为上述特征维度的第三变量,和将上述第四子信息表示为上述特征维度的第四变量,其中,上述第三子特征包括上述第三变量,上述第四子特征包括上述第四变量;上述第二融合子模块,包括:第二平均子单元,用于将相同上述特征维度的上述第三变量和上述第四变量进行第二平均处理,并将上述第二平均处理得到的结果,作为上述第二信息特征。

7、作为一种可选的方案,上述第一获取模块,包括:第一映射子模块,用于将上述媒体信息特征映射至多维空间内,得到第一特征向量;第二映射子模块,用于将上述第一信息特征映射至上述多维空间内,得到第二特征向量;第一计算子模块,用于计算上述第一特征向量和上述第二特征向量之间的第一余弦距离,其中,上述第一特征相似度与上述第一余弦距离呈正相关关系;

8、上述第二获取模块,包括:第三映射子模块,用于将上述第二信息特征映射至上述多维空间内,得到第三特征向量;第二计算子模块,用于计算上述第三特征向量和上述第二特征向量之间的第二余弦距离,其中,上述第二特征相似度与上述第二余弦距离呈正相关关系。

9、作为一种可选的方案,上述第二获取单元,包括:第一输入模块,用于将上述至少两个第一样本信息输入标签表示模型,得到上述第一标签表示,其中,上述标签表示模型为利用多个样本信息训练得到的、用于提取标签表示的神经网络模型;和,第二输入模块,用于将上述至少两个第二样本信息输入上述标签表示模型,得到上述第二标签表示。

10、作为一种可选的方案,上述装置还包括:第三获取模块,用于在上述将上述至少两个第一样本信息输入标签表示模型,得到上述第一标签表示之前,获取属于上述第一媒体标签的多个第一信息、属于上述第二媒体标签的多个第二信息,和至少一个验证信息,其中,上述多个样本信息包括上述多个第一信息、上述多个第二信息,和上述至少一个验证信息,上述验证信息属于上述第一媒体标签或上述第二媒体标签;第三输入模块,用于在上述将上述至少两个第一样本信息输入标签表示模型,得到上述第一标签表示之前,将上述多个第一信息和上述多个第二信息输入当前标签表示模型,得到上述当前标签表示模型输出的多个样本标签表示;分配模块,用于在上述将上述至少两个第一样本信息输入标签表示模型,得到上述第一标签表示之前,利用上述验证信息与上述样本标签表示之间的信息相似度,为上述至少一个验证信息中的各个验证信息分配对应的样本标签,其中,上述样本标签为上述第一媒体标签或上述第二媒体标签;第一确定模块,用于在上述将上述至少两个第一样本信息输入标签表示模型,得到上述第一标签表示之前,在上述样本标签的分配结果满足模型收敛条件的情况下,将上述当前标签表示模型确定为训练好的上述标签表示模型,其中,上述分配结果用于指示上述样本标签分成正确或错误;第二确定模块,用于在上述将上述至少两个第一样本信息输入标签表示模型,得到上述第一标签表示之前,在上述分配结果不满足上述模型收敛条件的情况下,利用上述分配结果,调整上述当前标签表示模型的模型参数,直至得到训练好的上述标签表示模型。

11、作为一种可选的方案,上述第一确定单元,包括:第三确定模块,用于在上述第一信息相似度大于上述第二信息相似度、且上述第一信息相似度与上述第二信息相似度之间的相似度差大于或等于第一预设阈值的情况下,将上述第一媒体标签确定为上述待识别媒体信息属于的媒体标签;上述第二确定单元,包括:第四确定模块,用于在上述第一信息相似度小于上述第二信息相似度、且上述相似度差大于或等于上述第一预设阈值的情况下,将上述第二媒体标签确定为上述待识别媒体信息属于的媒体标签;上述装置还包括:在上述响应于对待识别媒体信息触发的标签识别请求,获取上述待识别媒体信息与上述第一标签表示之间的第一信息相似度,和获取上述待识别媒体信息与上述第二标签表示之间的第二信息相似度之后,第五确定模块,用于在上述相似度差小于上述第一预设阈值的情况下,将上述第一媒体标签和上述第二媒体标签都确定为上述待识别媒体信息属于的媒体标签。

12、作为一种可选的方案,上述装置还包括:第四获取单元,用于在上述将上述第一媒体标签确定为上述待识别媒体信息属于的媒体标签,或上述将上述第二媒体标签确定为上述待识别媒体信息属于的媒体标签之后,获取当前已分配媒体标签的媒体信息对应的累计数量;训练单元,用于在上述将上述第一媒体标签确定为上述待识别媒体信息属于的媒体标签,或上述将上述第二媒体标签确定为上述待识别媒体信息属于的媒体标签之后,在上述累计数量大于或等于第二预设阈值的情况下,将上述当前已分配媒体标签的媒体信息、上述至少两个第一样本信息,和上述至少两个第二样本信息,共同作为训练样本,对初始的标签识别模型进行训练,直至得到训练好的标签识别模型,其中,上述标签识别模型为用于识别媒体信息属于的媒体标签。

13、作为一种可选的方案,上述装置还包括:第一校验单元,用于在上述获取路段定位请求之前,获取对道路路段触发的安装校验请求,其中,上述安装校验请求用于请求校验上述道路路段上安装的里程桩;第二校验单元,用于在上述获取路段定位请求之前,响应上述安装校验请求,获取上述道路路段的路段类型;第三校验单元,用于在上述获取路段定位请求之前,按照上述道路路段的路段类型对上述道路路段上安装的里程桩进行校验,并在校验不通过的情况下,显示里程桩安装信息,其中,上述里程桩安装信息用于指示进行上述道路路段上的里程桩安装。

14、作为一种可选的方案,上述校验单元,包括:第一校验模块,用于在上述道路路段的路段类型为第一目标类型的情况下,校验上述道路路段上已安装的里程桩;在上述道路路段上已安装的百米里程桩满足全路段安装的情况下,确定上述校验通过;第二校验模块,用于在上述道路路段的路段类型为第二目标类型的情况下,校验上述道路路段上已安装的里程桩;在上述道路路段上已安装的百米里程桩满足单路段安装的情况下,确定上述校验通过。

15、根据本技术实施例的又一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行如以上媒体信息的标签识别方法。

16、根据本技术实施例的又一方面,还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的媒体信息的标签识别方法。

17、在本技术实施例中,获取属于第一媒体标签的至少两个第一样本信息,和属于第二媒体标签的至少两个第二样本信息;利用上述至少两个第一样本信息获取上述第一媒体标签的第一标签表示,和利用上述至少两个第二样本信息获取上述第二媒体标签的第二标签表示,其中,上述第一标签表示用于表征属于上述第一媒体标签的信息内容,上述第二标签表示用于表征属于上述第二媒体标签的信息内容;响应于对待识别媒体信息触发的标签识别请求,获取上述待识别媒体信息与上述第一标签表示之间的第一信息相似度,和获取上述待识别媒体信息与上述第二标签表示之间的第二信息相似度,其中,上述标签识别请求用于请求确定上述待识别媒体信息属于的媒体标签;在上述第一信息相似度大于上述第二信息相似度的情况下,将上述第一媒体标签确定为上述待识别媒体信息属于的媒体标签;在上述第一信息相似度小于上述第二信息相似度的情况下,将上述第二媒体标签确定为上述待识别媒体信息属于的媒体标签。使用少量的样本信息,获取不同媒体标签的标签表示,再通过新的媒体信息与各个标签表示之间的信息相似度,为新的媒体信息匹配出对应的媒体标签,进而达到了无需收集充足的样本数据,也可对媒体信息进行标签识别的目的,从而实现了提高媒体信息的标签识别效率的技术效果,进而解决了媒体信息的标签识别效率较低的技术问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1