一种将Word文件转换成HTML文件的方法和装置与流程

文档序号:12665934阅读:来源:国知局

技术特征:

1.一种将Word文件转换成超级文本标记语言HTML文件的方法,其特征在于,包括:

获取待转换Word文件;

对所述待转换Word文件进行解压,生成资源索引文件、至少一个图片文件和至少一个文本文件;

根据所述资源索引文件、所述至少一个图片文件和所述至少一个文本文件,生成HTML头文件;

根据所述至少一个文本文件和所述资源索引文件,生成HTML文本文件;

根据所述HTML头文件、所述至少一个图片文件、所述资源索引文件、所述HTML文本文件,生成HTML文件。

2.根据权利要求1所述的方法,其特征在于,

所述资源索引文件中包括:每一个所述文本文件的组织结构信息;

所述根据所述至少一个文本文件和所述资源索引文件,生成HTML文本文件,包括:

根据所述至少一个文本文件和每一个所述文本文件的组织结构信息,生成可扩展标记语言XML文本文件;

对所述XML文本文件进行格式转换,生成HTML文本文件。

3.根据权利要求1所述的方法,其特征在于,

所述资源索引文件中包括:图片文件和地址的对应关系;

所述根据所述HTML头文件、所述至少一个图片文件、所述资源索引文件、所述HTML文本文件,生成HTML文件,包括:

确定所述HTML文本文件中每一个目标图片文件的地址;

根据所述图片文件和地址的对应关系,从所述至少一个图片文件中确定每一个所述目标图片文件的地址对应的目标图片文件;

将每一个所述目标图片文件按照对应的地址添加到所述HTML文本文件中,生成HTML主体文件;

根据所述HTML头文件和所述HTML主体文件,生成HTML文件。

4.根据权利要求1所述的方法,其特征在于,

进一步包括:预先设置级联样式表;

在所述根据所述HTML头文件、所述至少一个图片文件、所述资源索引文件、所述HTML文本文件,生成HTML文件之后,进一步包括:

利用所述级联样式表,对所述HTML文件进行格式化。

5.根据权利要求1-4任一所述的方法,其特征在于,

所述文本文件为内容文件、核心结构文件、个性化内容文件、页脚内容文件和页脚内容组织结构文件中任意一种。

6.一种将Word文件转换成超级文本标记语言HTML文件的装置,其特征在于,包括:

获取单元,用于获取待转换Word文件;

解压单元,用于对所述获取单元获取的所述待转换Word文件进行解压,生成资源索引文件、至少一个图片文件和至少一个文本文件;

HTML头文件生成单元,用于根据所述解压单元生成的所述资源索引文件、所述至少一个图片文件和所述至少一个文本文件,生成HTML头文件;

HTML文本文件生成单元,用于根据所述解压单元生成的所述至少一个文本文件和所述资源索引文件,生成HTML文本文件;

HTML文件生成单元,用于根据所述HTML头文件生成单元生成的所述HTML头文件、所述解压单元生成的所述至少一个图片文件和所述资源索引文件、所述HTML文本文件生成单元生成的所述HTML文本文件,生成HTML文件。

7.根据权利要求6所述的装置,其特征在于,

所述资源索引文件中包括:每一个所述文本文件的组织结构信息;

所述HTML文本文件生成单元,用于根据所述至少一个文本文件和每一个所述文本文件的组织结构信息,生成XML文本文件;对所述XML文本文件进行格式转换,生成HTML文本文件。

8.根据权利要求6所述的装置,其特征在于,

所述资源索引文件中包括:图片文件和地址的对应关系;

所述HTML文件生成单元,用于确定所述HTML文本文件中每一个目标图片文件的地址;根据所述图片文件和地址的对应关系,从所述至少一个图片文件中确定每一个所述目标图片文件的地址对应的目标图片文件;将每一个所述目标图片文件按照对应的地址添加到所述HTML文本文件中,生成HTML主体文件;根据所述HTML头文件和所述HTML主体文件,生成HTML文件。

9.根据权利要求8所述的装置,其特征在于,进一步包括:

设置单元,用于设置级联样式表;

格式化单元,用于利用所述设置单元设置的所述级联样式表,对所述HTML文件生成单元生成的所述HTML文件进行格式化。

10.根据权利要求6-9任一所述的装置,其特征在于,

所述文本文件为内容文件、核心结构文件、个性化内容文件、页脚内容文件和页脚内容组织结构文件中任意一种。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1