本发明涉及深度学习相关,尤其是指一种基于深度学习的盲文翻译方法。
背景技术:
1、盲文或称点字、凸字,是专为盲人设计、靠触觉感知的文字。透过点字板、点字机、点字打印机等在纸张上制作出不同组合的凸点而组成,一般每一个方块的点字是由六点组成,左侧从上到下为123,右侧为456,叫一方。它是由法国盲人路易·布莱尔于1824年创造的,故国际上通称为“布莱尔(braille)”。
2、现有的盲文翻译的操作方式中,只是简单的对盲文进行一对一的进行翻译,导致翻译后往往存在错别字、语句不通顺或者翻译不正确的问题。
技术实现思路
1、本发明是为了克服现有技术中存在上述的不足,提供了一种高精准度的基于深度学习的盲文翻译方法。
2、为了实现上述目的,本发明采用以下技术方案:
3、一种基于深度学习的盲文翻译方法,具体包括如下步骤:
4、(1)对盲文文本预处理:对盲文做编码归一化处理;
5、(2)深度学习算法模型构建:深度学习算法模型学习编码后的文本规律;
6、(3)训练深度学习模型:通过深度学习模型翻译出对应的翻译内容。
7、本发明通过盲文文本预处理对算法输入部分做编码归一化处理,然后经过深度学习模型学习编码后的文本规律,经过训练深度学习模型翻译出对应的中文内容,最后在经过文本纠错单元对错别字进一步纠错,达到高精准度文本翻译结果。
8、作为优选,在步骤(1)中,盲文文本预处理的具体方法如下:
9、(11)对于盲文句子,根据盲文的特点,每一个中文字符对应的盲文都采用三方对齐表示,不足三方的用数字0填充表示;
10、(12)将每个编码后的十进制数替换成0到63对应的十进制数字,替换后的数字序列就是预处理的最终结果。
11、作为优选,在步骤(2)中,深度学习模型构建的具体方法如下:
12、(21)对编码后的盲文句子进行词嵌入编码,输出词嵌入编码后的词向量;
13、(22)用cnn网络提取句子的语法信息和单词前后关联信息。
14、作为优选,在步骤(22)中,具体操作方法如下:
15、(221)该cnn网络的输入是经过词嵌入编码后的词向量;
16、(222)词向量经过三层一维卷积神经网络,每一层的卷积核依次为7、5、3,用于提取不同长度句子中的语法信息和单词前后关联信息。
17、作为优选,在步骤(3)中,训练深度学习模型的具体方法如下:
18、(31)收集不同领域的中文文本,进行文本清洗,按句子分割,按照《国家通用盲文》规则,生成中盲对齐语料;
19、(32)根据步骤(1)所述的文本预处理算法,对中盲对齐语料中的盲文进行编码;
20、(33)将常用汉字做成词典,对中盲对齐语料中的中文句子进行编码;
21、(34)中盲对齐语料中的盲文语句作为深度学习模型的input,中文句子作为深度学习模型的output。
22、本发明的有益效果是:通过盲文文本预处理对算法输入部分做编码归一化处理,然后经过深度学习模型学习编码后的文本规律,经过训练深度学习模型翻译出对应的中文内容,最后在经过文本纠错单元对错别字进一步纠错,达到高精准度文本翻译结果。
1.一种基于深度学习的盲文翻译方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于深度学习的盲文翻译方法,其特征在于,步骤(1)中,盲文文本预处理的具体方法如下:
3.根据权利要求1所述的基于深度学习的盲文翻译方法,其特征在于,步骤(22)中,具体操作方法如下:
4.根据权利要求1所述的基于深度学习的盲文翻译方法,其特征在于,步骤(3)中,训练深度学习模型的具体方法如下: