对UOF文档进行转换的方法与流程

文档序号:29354508发布日期:2022-03-22 23:28阅读:来源:国知局

技术特征:
1.对uof文档进行转换的方法,其特征在于,其包括如下步骤:步骤s1,对odf文档进行解压处理和解析处理,从而得到相应的文档解析输出;步骤s2,对所述文档解析输出进行样式分析,从而得到关于所述odf文档的文档属性数据;对所述文档属性数据进行预处理,从而得到相应文档样式属性数据和文档分节属性数据;再对所述文档样式属性数据和所述文档分节属性数据进行转换处理,从而得到与所述odf文档对应的uof文档;步骤s3,在文档外部接口的层面上,构建关于所述uof文档的动态链接库、可执行文件库、注册表和日志系统,从而实现对所述uof文档的二次开发和转换处理;步骤s4,在用户界面上显示对所述uof文档进行转换处理的实时信息。2.如权利要求1所述的对uof文档进行转换的方法,其特征在于:在所述步骤s1中,对odf文档进行解压处理和解析处理,从而得到相应的文档解析输出具体包括:步骤s101,基于开源代码zip utils设计形成文档解压缩模块,并利用所述文档解压缩模块对所述odf文档进行解压处理,从而得到所述odf文档包含xml文档;步骤s102,基于开源项目xerces c++设计形成sax解析模块,并利用所述sax解析模块对所述xml文档进行解析处理,从而得到相应的文档解析输出。3.如权利要求2所述的对uof文档进行转换的方法,其特征在于:在所述步骤s102中,利用所述sax解析模块对所述xml文档进行解析处理,从而得到相应的文档解析输出具体包括:利用所述sax解析模块对所述xml文档进行解析处理,以此对所述xml文档进行逐行扫描和解析处理,从而得到相应的xml文档解析结果和文档静态表,以此作为所述文档解析输出。4.如权利要求1所述的对uof文档进行转换的方法,其特征在于:在所述步骤s2中,对所述文档解析输出进行样式分析,从而得到关于所述odf文档的文档属性数据具体包括:对所述文档解析输出进行样式分析,从而得到所述odf文档包含的段落属性数据、文字属性数据、大纲属性数据、表格属性数据和图像属性数据;再定义getid函数对所述段落属性数据、所述文字属性数据、所述大纲属性数据、所述表格属性数据和所述图像属性数据进行处理,从而生成所述段落属性数据、所述文字属性数据、所述表格属性数据和所述图像属性数据各自对应的属性编号值。5.如权利要求4所述的对uof文档进行转换的方法,其特征在于:在所述步骤s2中,对所述文档解析输出进行样式分析,从而得到所述odf文档包含的段落属性数据、文字属性数据、大纲属性数据、表格属性数据和图像属性数据;再定义getid函数对所述段落属性数据、所述文字属性数据、所述大纲属性数据、所述表格属性数据和所述图像属性数据进行处理,从而生成所述段落属性数据、所述文字属性数据、所述表格属性数据和所述图像属性数据各自对应的属性编号值具体包括:所述文档中的不同属性的数据在进行连接时会在不同属性的数据中间存在一串连接符,根据所述连接符能够将所述文档解析输出分割成多个属性数据,接着根据每个属性数据中每个字节的属性定义将属性定义相同的属性数据归为一类,然后再定义getid函数以此根据归为一类的属性数据中每个字节
的属性定义得到其对应的属性编号值,其具体过程为:步骤s201,利用下面公式(1),根据所述连接符将所述文档解析输出分割成多个属性数据,其中1≤i≤m-n+1(1)在上述公式(1)中,μ
i
表示所述解析输出的文档中第i个字节处属于分割点的判定值;d
i+a
表示所述文档解析输出中第i+a个字节的二进制形式数值;p
1+a
表示所述连接符的第1+a个字节的二进制形式数值;n表示所述连接符的字节总数;m表示所述文档解析输出的字节总数;将i的值从1取值到m-n+1得到所有满足μ
i
=0的i值,在所述所有满足μ
i
=0的i值处的字节与其上一个字节的中间处作为分割点,对所述文档解析输出进行分割,分割完成后得到多个属性数据;步骤s202,通过上述步骤s201分割得到的多个属性数据,每个属性数据内部中每个字节的属性定义都是一致的,并且每个属性定义的名称也是由多个字节构成,利用下面公式(2),根据每个属性数据中每个字节的属性定义将属性定义相同的属性数据归为一类,其中r1≠r2
ꢀꢀꢀꢀ
(2)在上述公式(2)中,h(r1,r2)表示分割完成后的第r1个属性数据与第r2个属性数据能否归为一类的判定值;t
r1,e
表示分割完成后的第r1个属性数据的属性定义名称中的第e个字节的二进制形式数值;t
r2,e
表示分割完成后的第r2个属性数据的属性定义名称中的第e个字节的二进制形式数值;b
r1
表示分割完成后的第r1个属性数据的属性定义名称中的字节总数;b
r2
表示分割完成后的第r2个属性数据文档的属性定义名称中的字节总数;min()表示求取括号内的最小值;若h(r1,r2)≠0,表示分割完成后的第r1个属性数据与第r2个属性数据中字节的属性定义名称不同,即不能进行合并;若h(r1,r2)=0,表示分割完成后的第r1个属性数据与第r2个属性数据中字节的属性定义名称相同,即能够进行合并;通过上述步骤s202对分割得到的多个属性数据两两进行对比,将对比后的具有相同属性定义名称的属性数据全部合并归为一类,而合并为一类的属性数据即为所述段落属性数据、所述文字属性数据、所述大纲属性数据、所述表格属性数据或者所述图像属性数据;步骤s203,利用下面公式(3)作为getid函数,根据合为一类的属性数据中的字节个数以及合为一类的属性数据的属性定义名称,得到其对应的属性编号值,getid(c)={t
c
<<l[(s
c
)2]+(s
c
)2}
10
ꢀꢀꢀꢀ
(3)在上述公式(3)中,getid(c)表示合为一类的属性数据文档中的第c类属性数据文档的属性编号值;t
c
表示合为一类的属性数据文档中的第c类属性数据文档的属性定义名称所对应的二进制形式数值;s
c
表示合为一类的属性数据文档中的第c类属性数据文档的字节个数;()2表示将括号内的数值转换为二进制形式;l[(s
c
)2]表示将s
c
转换为二进制形式后二进制数的位数;{}
10
表示将括号内的数值转换为10进制。6.如权利要求4所述的对uof文档进行转换的方法,其特征在于:在所述步骤s2中,对所述文档属性数据进行预处理,从而得到相应文档样式属性数据
和文档分节属性数据具体包括:将所述odf文档包含的meta.xml文档、styles.xml文档、content.xml文档、uof.xml文档和rules.xml文档中段落属性数据、文字属性数据、大纲属性数据对应的属性编号值进行存储,从而作为所述文档样式属性数据和文档分节属性数据。7.如权利要求6所述的对uof文档进行转换的方法,其特征在于:在所述步骤s2中,对所述文档样式属性数据和所述文档分节属性数据进行转换处理,从而得到与所述odf文档对应的uof文档具体包括:对所述文档样式属性数据和所述文档分节属性数据进行主转换处理和后继转换处理;其中,所述主转换处理包括定义分别关于metatranslator、stylestranslator、contenttranslator的三种转换方式;并利用上述三种转换方式对所述文档样式属性数据和所述文档分节属性数据进行转换处理,从而将所述odf文档包含的meta.xml文档、styles.xml文档和content.xml文档进行转换处理;所述后继转换处理包括对所述uof.xml文档和所述rules.xml文档进行转换处理;再将对所述meta.xml文档、所述styles.xml文档和所述content.xml文档进行主转换处理的结果,以及对所述uof.xml文档和所述rules.xml文档进行后继转换处理的结果进行压缩,从而得到与所述odf文档对应的uof文档。8.如权利要求7所述的对uof文档进行转换的方法,其特征在于:在所述步骤s3中,在文档外部接口的层面上,构建关于所述uof文档的动态链接库、可执行文件库、注册表和日志系统,从而实现对所述uof文档的二次开发和转换处理具体包括:在文档外部接口的层面上,构建关于所述uof文档的动态链接库,再利用所述动态链接库为用户提供对所述uof文档的二次开发功能,从将所述uof文档能够集成到不同办公软件;在文档外部接口的层面上,构建关于所述uof文档的可执行文件库和注册表,再在所述可执行文件库形成的界面上,通过修改所述注册表的方式实现uof文档的批量转换;在文档外部接口的层面上,构建关于所述uof文档的日志系统,再利用所述日志系统记录文档转换的时间。9.如权利要求8所述的对uof文档进行转换的方法,其特征在于:在所述步骤s3中,在所述可执行文件库形成的界面上,通过修改所述注册表的方式实现uof文档的批量转换具体包括:在所述可执行文件形成的界面上,通过直接使用右键菜单或者使用命令行的方式修改所述注册表的方式实现uof文档的批量转换。10.如权利要求1所述的对uof文档进行转换的方法,其特征在于:在所述步骤s4中,在用户界面上显示对所述uof文档进行转换处理的实时信息具体包括:在用户界面上形成相应的信息展示窗口,所述信息展示窗口用于显示文档转换所处的阶段以及每个阶段对应的转换时间。

技术总结
本发明提供了对UOF文档进行转换的方法,其包括对ODF文档进行解压处理和解析处理,从而得到相应的文档解析输出;对文档解析输出进行样式分析,从而得到关于ODF文档的文档属性数据;对文档属性数据进行预处理,从而得到相应文档样式属性数据和文档分节属性数据;再对文档样式属性数据和文档分节属性数据进行转换处理,从而得到与所述ODF文档对应的UOF文档;并在文档外部接口的层面上,构建关于UOF文档的动态链接库、可执行文件库、注册表和日志系统,从而实现对UOF文档的二次开发和转换处理;最后在用户界面上显示对所述UOF文档进行转换处理的实时信息,从而实现对UOF文档进行批量转换和二次开发。批量转换和二次开发。批量转换和二次开发。


技术研发人员:王丹星 周韩钰 余丹
受保护的技术使用者:慧之安信息技术股份有限公司
技术研发日:2021.11.22
技术公布日:2022/3/21
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1