一种基于深度学习的盲文翻译方法与流程

文档序号:34316269发布日期:2023-05-31 23:53阅读:57来源:国知局

本发明涉及深度学习相关,尤其是指一种基于深度学习的盲文翻译方法。


背景技术:

1、盲文或称点字、凸字,是专为盲人设计、靠触觉感知的文字。透过点字板、点字机、点字打印机等在纸张上制作出不同组合的凸点而组成,一般每一个方块的点字是由六点组成,左侧从上到下为123,右侧为456,叫一方。它是由法国盲人路易·布莱尔于1824年创造的,故国际上通称为“布莱尔(braille)”。

2、现有的盲文翻译的操作方式中,只是简单的对盲文进行一对一的进行翻译,导致翻译后往往存在错别字、语句不通顺或者翻译不正确的问题。


技术实现思路

1、本发明是为了克服现有技术中存在上述的不足,提供了一种高精准度的基于深度学习的盲文翻译方法。

2、为了实现上述目的,本发明采用以下技术方案:

3、一种基于深度学习的盲文翻译方法,具体包括如下步骤:

4、(1)对盲文文本预处理:对盲文做编码归一化处理;

5、(2)深度学习算法模型构建:深度学习算法模型学习编码后的文本规律;

6、(3)训练深度学习模型:通过深度学习模型翻译出对应的翻译内容。

7、本发明通过盲文文本预处理对算法输入部分做编码归一化处理,然后经过深度学习模型学习编码后的文本规律,经过训练深度学习模型翻译出对应的中文内容,最后在经过文本纠错单元对错别字进一步纠错,达到高精准度文本翻译结果。

8、作为优选,在步骤(1)中,盲文文本预处理的具体方法如下:

9、(11)对于盲文句子,根据盲文的特点,每一个中文字符对应的盲文都采用三方对齐表示,不足三方的用数字0填充表示;

10、(12)将每个编码后的十进制数替换成0到63对应的十进制数字,替换后的数字序列就是预处理的最终结果。

11、作为优选,在步骤(2)中,深度学习模型构建的具体方法如下:

12、(21)对编码后的盲文句子进行词嵌入编码,输出词嵌入编码后的词向量;

13、(22)用cnn网络提取句子的语法信息和单词前后关联信息。

14、作为优选,在步骤(22)中,具体操作方法如下:

15、(221)该cnn网络的输入是经过词嵌入编码后的词向量;

16、(222)词向量经过三层一维卷积神经网络,每一层的卷积核依次为7、5、3,用于提取不同长度句子中的语法信息和单词前后关联信息。

17、作为优选,在步骤(3)中,训练深度学习模型的具体方法如下:

18、(31)收集不同领域的中文文本,进行文本清洗,按句子分割,按照《国家通用盲文》规则,生成中盲对齐语料;

19、(32)根据步骤(1)所述的文本预处理算法,对中盲对齐语料中的盲文进行编码;

20、(33)将常用汉字做成词典,对中盲对齐语料中的中文句子进行编码;

21、(34)中盲对齐语料中的盲文语句作为深度学习模型的input,中文句子作为深度学习模型的output。

22、本发明的有益效果是:通过盲文文本预处理对算法输入部分做编码归一化处理,然后经过深度学习模型学习编码后的文本规律,经过训练深度学习模型翻译出对应的中文内容,最后在经过文本纠错单元对错别字进一步纠错,达到高精准度文本翻译结果。



技术特征:

1.一种基于深度学习的盲文翻译方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于深度学习的盲文翻译方法,其特征在于,步骤(1)中,盲文文本预处理的具体方法如下:

3.根据权利要求1所述的基于深度学习的盲文翻译方法,其特征在于,步骤(22)中,具体操作方法如下:

4.根据权利要求1所述的基于深度学习的盲文翻译方法,其特征在于,步骤(3)中,训练深度学习模型的具体方法如下:


技术总结
本发明公开了一种基于深度学习的盲文翻译方法,包括如下步骤:(1)收集盲文文本,并对盲文文本预处理:对盲文做编码归一化处理;(2)构建深度学习算法模型:深度学习算法模型学习编码后的文本规律,包括:(21)对编码后的盲文句子进行词嵌入编码,输出词嵌入编码后的词向量;(22)用cnn网络提取句子的语法信息和单词前后关联信息;(3)训练深度学习模型:通过深度学习模型翻译出对应的翻译内容。

技术研发人员:周健民
受保护的技术使用者:甘肃奇誉科技有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1