一种文件转换方法、计算机设备和存储介质与流程

文档序号：29076374发布日期：2022-03-01 22:52阅读：来源：国知局

技术特征：
1.一种文件转换方法，其特征在于，包括：将源文件中每页原始页面转换为第一图像数据；针对每帧所述第一图像数据，在按照排版划分的每个版面中检测内容类型单一的区域，所述类型包括适于光学字符识别的第一类型、不适于光学字符识别的第二类型；对所述区域识别符合所述排版的顺序；对属于所述第一类型的所述区域执行光学字符识别，得到可编辑内容；按照所述顺序将所述可编辑内容与属于所述第二类型的所述区域按照所述排版合并为可编辑的目标页面；将所述目标页面合并为可编辑目标文件。2.根据权利要求1所述的方法，其特征在于，所述针对每帧所述第一图像数据，在按照排版划分的每个版面中检测内容类型单一的区域，包括：确定结构属于u型网络的图像分割模型；针对每帧所述第一图像数据，将所述第一图像数据输入所述图像分割模型，以在按照排版划分的每个版面中检测内容类型单一的区域。3.根据权利要求2所述的方法，其特征在于，所述确定结构属于u型网络的图像分割模型，包括：获取结构属于u型网络的图像分割模型；获取第二图像数据，所述第二图像数据由样本文件中的样本页面转换，所述第二图像数据中标记有按照排版划分的每个版面中检测内容类型单一的区域，所述类型包括适于光学字符识别的第一类型、不适于光学字符识别的第二类型；将所述第二图像数据输入所述图像分割模型，以在按照排版划分的每个版面中预测内容类型单一的区域；计算标注的所述区域与预测的所述区域之间的差异，作为损失值；按照所述损失值更新所述图像分割模型；判断当前迭代的次数是否达到预设的阈值；若是，则确定所述图像分割模型训练完成，若否，则返回执行所述将所述第二图像数据输入所述图像分割模型，以在按照排版划分的每个版面中预测内容类型单一的区域。4.根据权利要求2所述的方法，其特征在于，所述确定结构属于u型网络的图像分割模型，还包括：获取第三图像数据，所述第三图像数据由样本文件中的样本页面转换，所述第三图像数据中标记有按照排版划分的每个版面中检测内容类型单一的区域，所述类型包括适于光学字符识别的第一类型、不适于光学字符识别的第二类型；将所述第三图像数据输入所述图像分割模型，以在按照排版划分的每个版面中预测内容类型单一的所述区域；判断标注的所述区域与预测的所述区域的边缘是否吻合；若是，则确定所述图像分割模型通过测试；若否，则返回执行所述将所述第二图像数据输入所述图像分割模型，以在按照排版划分的每个版面中预测内容类型单一的区域。5.根据权利要求1所述的方法，其特征在于，所述对所述区域识别符合所述排版的顺
序，包括：若所述第一图像数据中包含所述第一区域，则对每个所述第一区域取第一标识点，所述第一区域为所述第一类型的所述区域，所述第一标识点为位于所述第一区域的最小外接矩形的左上角的点；计算每个所述第一区域的所述第一标识点与第一原点之间的第一距离，所述第一原点为位于所述第一图像数据左上角的点；按照所述第一距离对所述第一区域进行升序排序，得到符合所述排版的顺序；若两个所述第一区域的所述第一距离相等，则将横坐标较小的所述第一区域排序在横坐标较大的所述第一区域之前。6.根据权利要求1所述的方法，其特征在于，所述对所述区域识别符合所述排版的顺序，还包括：若所述第一图像数据中包含第一区域、第二区域，则对每个所述第一区域取第一标识点，对每个所述第二区域取第二标识点，所述第一区域为所述第一类型的所述区域，所述第二区域为所述第二类型的所述区域，所述第一标识点为位于所述第一区域的最小外接矩形的左上角的点，所述第二标识点为位于所述第二区域的最小外接矩形的右上角的点；以所述第二标识点为第二原点，建立坐标空间，所述坐标空间包括第一象限、第二象限、第三象限、第四象限；计算每个所述第二区域的所述第二标识点与第一原点之间的第二距离，所述第一原点为位于所述第一图像数据左上角的点；按照所述第二距离对所述第二区域进行升序排序，得到识别符合所述排版的顺序；若两个所述第二区域的所述第二距离相等，则将横坐标较小的所述第二区域排序在横坐标较大的所述第二区域之前；按照所述第二区域的顺序，依次遍历位于所述第二区域对应的所述第三象限、所述第四象限中的未排序的所述第一区域，作为第一目标区域；计算每个所述第一目标区域的所述第一标识点与第一原点之间的第一距离，所述第一原点为位于所述第一图像数据左上角的点；按照所述第一距离对所述第一目标区域进行升序排序，得到符合所述排版的顺序；若两个所述第一目标区域的所述第一距离相等，则将横坐标较小的所述第一目标区域排序在横坐标较大的所述第一目标区域之前。7.根据权利要求6所述的方法，其特征在于，所述对所述区域识别符合所述排版的顺序，还包括：在遍历完所述第二区域之后，查询剩余未排序的所述第一区域，作为第二目标区域，所述第一区域为所述第一类型的所述区域；计算每个所述第二目标区域的所述第一标识点与第一原点之间的第一距离，所述第一原点为位于所述第一图像数据左上角的点；按照所述第一距离对所述第二目标区域进行升序排序，得到符合所述排版的顺序；若两个所述第二目标区域的所述第一距离相等，则将横坐标较小的所述第二目标区域排序在横坐标较大的所述第二目标区域之前。8.根据权利要求1-7任一项所述的方法，其特征在于，所述对属于第一类型的所述区域
执行光学字符识别，得到可编辑内容，包括：对属于所述第一类型的所述区域执行图像增强操作；当所述图像增强操作执行后，对属于所述第一类型的所述区域执行光学字符识别，得到单个文本；对所述单个文本进行聚类，得到以单行文本的形式记录的可编辑内容。9.根据权利要求8所述的方法，其特征在于，所述按照所述顺序将所述可编辑内容与所述第二类型的所述区域按照排版合并为可编辑的目标页面，包括：对在所述顺序上相邻的两行所述文本进行连续性检测；若所述连续性检测的结果表示在所述顺序上相邻的两行所述文本属于同一个段落，则将在所述顺序上相邻的两行所述文本拼接在同一个所述段落中；对在所述顺序上排序在所述第二类型的所述区域之前及之后的两行所述文本进行所述连续性检测；若所述连续性检测的结果表示在所述顺序上相邻的两行所述文本属于同一个所述段落，则将在所述顺序上相邻的两行所述文本拼接在同一个所述段落中；按照所述顺序将拼接之后的所述段落与所述第二类型的所述区域按照所述排版合并为可编辑的目标页面。10.一种计算机设备，其特征在于，所述计算机设备包括：一个或超过一个处理器；存储器，用于存储一个或超过一个程序，当所述一个或超过一个程序被所述一个或超过一个处理器执行，使得所述一个或超过一个处理器实现如权利要求1-9中任一项所述的文件转换方法。11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1-9中任一项所述的文件转换方法。

技术总结
本发明实施例提供了一种文件转换方法、装置、计算机设备和介质，该方法包括：将源文件每页原始页面转换为第一图像数据，针对第一图像数据，在按照排版划分的每个版面中检测内容类型单一的区域，类型包括适于光学字符识别的第一类型、不适于光学字符识别的第二类型，对区域识别符合排版的顺序，对属于第一类型的区域执行光学字符识别，得到可编辑内容，按照顺序将可编辑内容与属于第二类型的区域按照排版合并为可编辑的目标页面，最后将目标页面合并为可编辑目标文件。本发明实施例提供的方法通过在文件转换的过程中引入将源文件中各区域进行分类的操作以及排序操作，减少了文字识别错乱的概率。错乱的概率。错乱的概率。

技术研发人员：刘一峰黄进然
受保护的技术使用者：广州万孚生物技术股份有限公司
技术研发日：2021.11.22
技术公布日：2022/2/28

完整全部详细技术资料下载

当前第2页1 2