中文汉字自动标注拼音的系统及其标注方法
【技术领域】
[0001] 本发明涉及一种中文汉字标注拼音的系统及其标注方法,特别涉及一种中文汉字 自动标注拼音的系统及其标注方法。
【背景技术】
[0002] 目前,不少出版社为了让孩子多识字,多读书,出版了大量多种多样的注音读物。 注音读物就是在文章中的文字上方标注拼音的读物。除了常见的各类童话故事、少儿故事 和科普读本,一些经典文学名著等也被改编成标注有拼音的精简本。
[0003] 但是,不同的汉字,其对应的拼音英文字母数不一,例如"的"对应的拼音英文字母 数仅2个,"常"对应的拼音英文字母数有5个,而有的汉字对应的拼音英文字母数高达6 个,例如"状"、"双"、"窗"等。因此,现有的注音读物存在以下问题:
[0004] (例如下面作为比较例1的一段标注有拼音的文字,摘自2013年出版的《EQ情商 教育童话自我认知卷》第12页)
[0005]
[0006] 1.为了使英文字母排在汉字的正上方,必然会造成汉字之间的字距不一,从而严 重破坏注音读物版面的整齐和美观。例如在上面的一段文字中"常"与"常"之间和"常"与 "嘲"之间的间距远大于"完"与"好"之间和"好"与"的"之间的间距。
[0007] 2.汉字过大,而英文字母过小。在上述比较例1中汉字是加粗华文楷体"四号"字, 英文字母是"小六号"(与原著完全一致)。如果文章中有"状"等汉字,为了使"状"对应的 拼音"zhuang"正好排在"状"字的正上方和使汉字之间的字距相同,则当汉字使用"一号" 字(尺寸为9. 17_)时,即使英文字母采用"七号"字(尺寸为1. 94_),也会偏大。
[0008] 3.由于拼音英文字母过小,不仅影响儿童的学习,而且对于儿童的视力将造成不 良的影响。
[0009] 另外,对于学习汉字的人而言,如何根据用户需求而自动为中文汉字标注拼音,使 有注音需求的用户随时能够了解中文汉字的读音,也是迫切需要解决的问题。
【发明内容】
[0010] 本发明的目的在于解决现有拼音读物中存在的上述问题。
[0011] 为了实现上述目的,提供一种中文汉字自动标注拼音的系统,用于对中文汉字自 动标注拼音,
[0012]该系统包括:一数据库,储存有中文汉字及其对应的拼音,所述数据库中的中文汉 字包括单字和词组,所述数据库中的拼音包括单字对应的拼音和词组对应的拼音,所述词 组对应的优先级别较高,拼音采用两拼法,即每个中文汉字至多用两个字符标注拼音,声母 采用下列表1和表2的两种声母表中的一种,而韵母采用下列表3至表9的七种韵母表中 的一种,其中韵母i、u和U分别用韵母字符或"="或"…"代替;
[0013] [表 1]
[0014] 声母表一
[0031][表 7]
[0032] 韵母表五
[0040] 一提取模块,采用全屏提取的方式,提取当前所显示的中文页面中的中文汉字串, 或采用鼠标取词的方式,提取当前鼠标所在位置的中文汉字串,并将该中文汉字串与该数 据库中的词组对比,判断该中文汉字串能否组成词组,如果不能,则与所述单字进行对比;
[0041] 一转换模块,根据该数据库,将该中文汉字串转换为对应的拼音;及
[0042] 一显示模块,将该拼音显示在与该中文汉字串对应的位置。
[0043] 另外,对于所述的中文汉字自动标注拼音的系统,上述韵母表一至韵母表七中的 韵母字符""和"…"分别用" | " | | "和》代替。
[0044] 另外,对于所述的中文汉字自动标注拼音的系统,显示模块还包括一位置单元,用 以确定该拼音的显示区域。
[0045] 另外,对于所述的中文汉字自动标注拼音的系统,显示区域为该页面中的中文汉 字串的各汉字的正上方区域,或在当前鼠标所在位置开启的一窗口。
[0046] 本发明还提供了一种中文汉字自动标注拼音的方法,用于对中文汉字自动标注拼 音,
[0047] 该方法包括如下步骤:建立中文汉字与对应的拼音的数据库,所述数据库中的中 文汉字包括单字和词组,所述数据库中的拼音包括单字对应的拼音和词组对应的拼音,所 述词组对应的优先级别较高,拼音采用两拼法,即每个中文汉字至多用两个字符标注拼音, 声母采用上述表1和表2的两种声母表中的一种,而韵母采用上述表3至表9的七种韵母 表中的一种,其中韵母i、u和U分别用韵母字符或"="或"…"代替;
[0048] 提取中文页面,采用全屏提取的方式,提取当前显示的中文页面中的中文汉字串, 或采用鼠标取词的方式,提取当前鼠标所在位置的中文汉字串,并将该中文汉字串与该数 据库中的词组对比,判断该中文汉字串能否组成词组,如果不能,则与所述单字进行对比; [0049] 根据该数据库将该中文汉字串转换为对应的拼音;及
[0050] 将该拼音显示在与该中文汉字串对应的位置。
[0051] 另外,对于所述的中文汉字自动标注拼音的方法,上述韵母表一至韵母表七中的 韵母字符或"="或"…"分别用"|"、"|I"》;?代替。
[0052] 另外,所述的中文汉字自动标注拼音的方法,还包括确定该拼音的显示区域的步 骤。
[0053] 另外,对于所述的中文汉字自动标注拼音的方法,所述确定该拼音的显示区域的 步骤是将该中文汉字串的各汉字的正上方或在当前鼠标的所在位置开启一窗口作为显示 区域。
[0054] 根据本发明的中文汉字自动标注拼音的系统及其标注方法,不仅能够自动为中文 网页中所有的中文汉字标注拼音,而且在每个汉字的正上方仅标注两个字符组成的拼音或 一个字符的拼音,从而使注音读物的版面整齐、美观,同时使拼音字符的大小显著地增大, 另外,本发明中的韵母以及各种字符容易记忆,因此,非常有利于孩子的学习和保护孩子的 视力。结合屏幕取词功能,可以根据用户需要,在显示的页面中截取中文汉字,显示其对应 的拼音,从而使用户可以随时了解该中文汉字的读音,方便了用户的使用。
【附图说明】
[0055] 图1是本发明的中文汉字自动标注拼音的系统的模块结构图。
[0056] 图2是本发明的实施方式的模块结构图。
[0057] 图3是本发明的中文汉字自动标注拼音的方法的流程图。
[0058] 图4是本发明的第一实施方式页面转换的流程图。
[0059] 图5是本发明的第二实施方式的鼠标取词的流程图。
【具体实施方式】
[0060] 下面对本发明进行详细说明。
[0061] 图1是本发明的中文汉字自动标注拼音系统的模块结构图,包括一数据库110,一 提取模块120, 一转化模块130以及一显不模块140。
[0062] 下面对本系统的各模块进行详细说明:
[0063] (1)数据库110,储存有中文汉字及其按两拼法对应的拼音,包括中文汉字的单字 对应的拼音和由单字组成的词对应的拼音。
[0064] (2)提取模块120,用于根据用户需要提取当前页面中的中文汉字。如果用户选择 全屏提取,则提取模块120提取当前页面中的所有中文汉字。如果用户选择鼠标取词,则提 取模块120只提取当前鼠标所在位置的中文汉字,同时判断当前汉字与其相邻汉字能否组 成词组,如果能够组成词组,则提取词组。
[0065] (3)转换模块130,用于接收提取模块120提取的内容,并且通过数据库110,将该 中文汉字转换为对应的拼音。
[0066] (4)显示模块140,用于将该拼音显示在与该汉字对应的位置。其中,显示模块140 还包括一位置单元141 (见图2),用以确定拼音显示的具体位置。如果用户选择全屏提取, 则位置单元141将中文汉字的正上方作为显示区域,使中文汉字与拼音对应。如果用户选 择的是鼠标取词,则该位置单元141将根据当前鼠标所在的位置,自动开启一显示窗口,作 为拼音显示区域。
[0067] 参见图3,该图是本发明的中文汉字自动标注拼音的方法的流程图,首先建立中文 汉字及其按两拼法对应的拼音的数据库(步骤310),然后,提取当前页面中的中文汉字(步 骤320