本发明总体上涉及计算领域,并且更具体地涉及自然语言处理。
背景技术:
1、自然语言处理(nlp)是与计算机和人类自然语言之间的交互有关的计算机科学、人工智能和计算语言学的领域,诸如对计算机进行编程以处理包含大的自然语言语料库的多媒体文件。通常,nlp的人工智能组件结合一个或多个神经网络,该神经网络被训练来识别或处理自然语言。
2、神经网络是基于神经单元集合的计算机科学中的计算模型。每个神经单元是人工神经元,该人工神经元可以与其他神经单元连接以创建神经网络。神经网络然后可以被训练以找到针对传统计算机程序失败的问题的解决方案,诸如文本或词嵌入的nlp。
技术实现思路
1、根据一个实施例,提供一种用于回指消歧(anaphora disambiguation)的方法、计算机系统和计算机程序产品。本发明可包括计算机接收多媒体数据,该多媒体数据包括多个帧。计算机将多媒体数据转换成具有多个频率和多个振幅的信号波。计算机从多个帧中确定具有代词的帧。计算机识别帧的主题。计算机在媒体存储库中搜索与该帧的主题具有最高相关系数的帧,其中,来自媒体存储库的帧包括对象袋(bag of objects),并且通过用来自对象袋的对象替换代词来解析回指消歧。
1.一种用于回指消歧的处理器实现的方法,所述方法包括:
2.根据权利要求1所述的方法,其中,将所述多媒体数据转换成所述信号波包括:
3.根据权利要求1所述的方法,其中,所述多个帧中的每个帧具有持续时间,并且其中,基于所述信号波的短期傅里叶变换来确定所述持续时间。
4.根据权利要求1所述的方法,进一步包括:
5.根据权利要求4所述的方法,其中,所述最高相关系数是基于所述频谱图方法的。
6.根据权利要求1所述的方法,进一步包括:
7.根据权利要求6所述的方法,进一步包括:
8.一种用于回指消歧的计算机系统,所述计算机系统包括:
9.根据权利要求8所述的计算机系统,其中,将所述多媒体数据转换成所述信号波包括:
10.根据权利要求8所述的计算机系统,其中,所述多个帧中的每个帧具有持续时间,并且其中,基于所述信号波的短期傅里叶变换来确定所述持续时间。
11.根据权利要求8所述的计算机系统,进一步包括:
12.根据权利要求11所述的计算机系统,其中,所述最高相关系数是基于所述频谱图方法的。
13.根据权利要求8所述的计算机系统,进一步包括:
14.根据权利要求13所述的计算机系统,进一步包括生成描述所述对象的向量,其中,所述向量包括速度、加速度和所述标签。
15.一种用于回指消歧的计算机程序产品,所述计算机程序产品包括:
16.根据权利要求15所述的计算机程序产品,其中,将所述多媒体数据转换成所述信号波的程序指令包括:
17.根据权利要求15所述的计算机程序产品,其中,所述多个帧中的每个帧具有持续时间,并且其中,基于所述信号波的短期傅里叶变换来确定所述持续时间。
18.根据权利要求15所述的计算机程序产品,进一步包括:
19.根据权利要求18所述的计算机程序产品,其中,所述最高相关系数是基于所述频谱图方法的。
20.根据权利要求15所述的计算机程序产品,进一步包括: