技术特征:
1.一种语音信息的获取方法,其特征在于,包括:获取第一语言的文本语料,并判断所述文本语料中是否包括第二语言的外来词;若所述文本语料中包括第二语言的外来词,则获取所述外来词在所述第二语言中的音素信息;根据所述第一语言与所述第二语言的音素关联关系,以及所述外来词在所述第二语言中的音素信息,获取所述外来词在所述第一语言中的音素信息。2.根据权利要求1所述的方法,其特征在于,所述判断所述文本语料中是否包括第二语言的外来词,包括:根据文本分类模型以及命名实体识别模型,判断所述文本语料中是否包括第二语言的外来词;或根据文本分类模型,判断所述文本语料中是否包括第二语言的外来词。3.根据权利要求2所述的方法,其特征在于,所述文本分类模型包括基于transformer架构的神经网络模型、卷积神经网络模型和/或循环神经网络模型;和/或所述命名实体识别模型包括隐马尔可夫模型、最大熵马尔可夫模型、条件随机场模型和/或深度学习模型。4.根据权利要求1所述的方法,其特征在于,所述获取所述外来词在所述第二语言中的音素信息,包括:根据所述第二语言的词典信息,判断所述外来词是否为所述第二语言中的标准词;其中,所述第二语言的词典信息包括第二语言中字符与音素信息的对应关系;若确定所述外来词是所述第二语言中的标准词,则根据所述第二语言的词典信息,获取所述外来词在所述第二语言中的音素信息。5.根据权利要求4所述的方法,其特征在于,在判断所述外来词是否为所述第二语言中的标准词后,包括:若确定所述外来词不是所述第二语言中的标准词,则根据所述第一语言与所述第二语言的字符关联关系,获取所述第二语言中与所述外来词对应的关联标准词;根据所述第二语言的词典信息,获取所述关联标准词在所述第二语言中的音素信息,并作为所述外来词在所述第二语言中的音素信息。6.根据权利要求1所述的方法,其特征在于,在获取所述外来词在所述第二语言中的音素信息后,还包括:通过字母到音素模型,获取所述文本语料中非外来词在所述第一语言中的音素信息;其中,所述非外来词为除所述外来词以外的剩余词;根据所述外来词在所述第一语言中的音素信息,以及所述非外来词在所述第一语言中的音素信息,获取所述文本语料在所述第一语言下的语音信息。7.根据权利要求1
‑
6中任一所述的方法,其特征在于,所述第一语言为英语,所述第二语言为汉语,所述外来词为拼音词。8.一种语音信息的获取装置,其特征在于,包括:外来词判断模块,用于获取第一语言的文本语料,并判断所述文本语料中是否包括第二语言的外来词;第一音素信息获取模块,用于若所述文本语料中包括第二语言的外来词,则获取所述
外来词在所述第二语言中的音素信息;第二音素信息获取模块,用于根据所述第一语言与所述第二语言的音素关联关系,以及所述外来词在所述第二语言中的音素信息,获取所述外来词在所述第一语言中的音素信息。9.一种电子设备,包括存储器、处理装置及存储在存储器上并可在处理装置上运行的计算机程序,其特征在于,所述处理装置执行所述程序时实现如权利要求1
‑
7中任一所述的语音信息的获取方法。10.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1
‑
7中任一所述的语音信息的获取方法。