1.一种移动终端,其特征在于,所述移动终端包括:
接收单元,用于接收同时存在的多个人物的语音信息,并将所述语音信息发送给提取单元;
所述提取单元,用于在全部语音信息中提取至少N个声纹特征,并将所述声纹特征发送给转换单元;其中,N为大于等于2的自然数;
所述转换单元,用于根据N个声纹特征将全部语音信息转换为不同人物对应的文本信息。
2.根据权利要求1所述的移动终端,其特征在于,所述提取单元用于采用多个采样周期在全部语音信息中提取至少N个声纹特征;或者,采用多个采样频率在全部语音信息中提取至少N个声纹特征。
3.根据权利要求1所述的移动终端,其特征在于,所述转换单元包括:
匹配子单元,用于将N个声纹特征分别与预先存储的声纹特征进行匹配,并将匹配结果发送给转换子单元;
转换子单元,用于根据所述匹配结果将全部语音信息转换为各个人物对应的文本信息。
4.根据权利要求3所述的移动终端,其特征在于,所述转换子单元用于判断各个声纹特征是否与至少一个预先存储的声纹特征匹配成功;若匹配成功,将各个声纹特征转换为各个人物对应的文本信息。
5.根据权利要求3所述的移动终端,其特征在于,所述匹配子单元用于将N个声纹特征分别与预先存储的多种格式的声纹特征进行匹配;或者,将N个声纹特征分别与预先存储的多个声道的声纹特征进行匹配。
6.一种语音到文本的转换方法,其特征在于,所述方法包括:
接收同时存在的多个人物的语音信息;
在全部语音信息中提取至少N个声纹特征;其中,N为大于等于2的自然数;
根据N个声纹特征将全部语音信息转换为不同人物对应的文本信息。
7.根据权利要求6所述的方法,其特征在于,所述在全部语音信息中提取至少N个声纹特征,包括:
采用多个采样周期在全部语音信息中提取至少N个声纹特征;
或者,采用多个采样频率在全部语音信息中提取至少N个声纹特征。
8.根据权利要求6所述的方法,其特征在于,所述根据N个声纹特征将全部语音信息转换为不同人物对应的文本信息,包括:
将N个声纹特征分别与预先存储的声纹特征进行匹配;
根据匹配结果将全部语音信息转换为各个人物对应的文本信息。
9.根据权利要求8所述的方法,其特征在于,所述根据匹配结果将全部语音信息转换为各个人物对应的文本信息,包括:
判断各个声纹特征是否与至少一个预先存储的声纹特征匹配成功;
若匹配成功,将各个声纹特征转换为各个人物对应的文本信息。
10.根据权利要求8所述的方法,其特征在于,所述将N个声纹特征分别与预先存储的声纹特征进行匹配,包括:
将N个声纹特征分别与预先存储的多种格式的声纹特征进行匹配;
或者,将N个声纹特征分别与预先存储的多个声道的声纹特征进行匹配。