专利资料多语言文字显示方法及系统的制作方法

文档序号:6576320阅读:219来源:国知局
专利名称:专利资料多语言文字显示方法及系统的制作方法
技术领域
本发明涉及一种多语言文字显示方法及系统,特别涉及一种通过在应用服务器中将二进制数据流转换为Unicode字符流,从而可在客户机上正确显示多语言专利资料的方法及系统。
背景技术
各种语言的字符各有不同,为在计算机及电子装置内处理各国家地区的语言字符,各种不同语言采用了不同的编码标准。世界各国的专利文献是由专利局以本国或地区官方语言公布,因此所使用的语言文字差异很大。而各国专利数据库所采用的编码标准也由此不尽相同。例如美国专利资料采用美国标准信息交换码(ASCII);而欧洲国家通常采用ISO 8859-X系列标准;中国则采用国标码(GB2312)编码标准。各种不同的编码标准互不兼容,一个编码在不同的编码标准内可能代表不同的字符,导致某一地区发出的电子信息,在传送到其它地区的计算机系统时,可能会出现乱码或某些字符不能正确地显示等问题。这给不同国家之间专利资料的查阅带来了诸多不便。
而Unicode标准编码提供了一套统一的字符编码标准,该编码标准涵盖了各种主要语言的字符,方便世界各地的计算机用户进行电子通讯及资料交换。采用该标准后,世界各地不同的计算机系统之间便能更准确地储存、处理、传递及显示各种语言的电子信息,从而加强各地间电子信息的流通及推动电子交易的进行。
在分布式网络中客户机与数据库之间的资料传递都要经过应用服务器。一般的分布式网络系统如图1所示,若干台客户机10通过企业内部网络11与应用服务器12相连,以向中央数据库13写入或读取资料。在中央数据库13中,所有的资料都是以二进制数据的形式存储的,因此在进入中央数据库13之前,所有资料必须被转换为二进制数据。在分布式网络系统中,资料的存储过程如下客户机10的操作系统将其从远程专利数据库(一数据库,通过互联网与客户机10相连)下载的专利资料自动转换为Unicode字符,然后传递至应用服务器12,在应用服务器12中,Unicode字符流被转换为二进制数据流,转换成的二进制数据流经过应用服务器12的数据库驱动器(ODBC Driver)存入中央数据库13中。读取资料的过程如下,中央数据库13响应客户机10的请求,将相关的专利资料以二进制数据流的形式发送到应用服务器12,在应用服务器12的系统缓存中作短暂停留后以二进制数据流的形式传送到客户机10,客户机10的操作系统自动将二进制数据流转换为Unicode字符流,然后以字符的形式显示给用户。操作系统在进行Unicode字符流与二进制数据流的转换过程中,系统的语言设置将被作为一个参数带入二进制数据流,在作相反转换时就会根据这一参数进行。由于这两步转换不是在同一系统中执行,就可能因为不同系统的语言设置而导致应用服务器12传送的专利资料不能在客户机10正确显示,即在客户机10上出现乱码。目前解决这一问题的主要方法是在客户机10上安装编码转换软件,如美国专利局2001年5月20日公告的第6,204,782号名为“Unicode转换为多种编码”(Unicode Conversion into MultipleEncodings)的专利。该发明利用一编码对照表,自动识别某一编码(例如Unicode)的文件,然后将该编码的文件根据系统的语言设置转换为系统能识别的编码,显示给用户。虽然这一方法能有效处理乱码问题,但无疑加重了客户机10的负担,既影响了查阅速度又增加了系统的成本。

发明内容本发明的主要目的在于提供一种利用Unicode解决专利多语言显示的方法及系统,其可使不同语言编码的专利文件能在客户机上正确显示,而无需在客户机上安装编码转换软件。
为达成上述发明目的,本发明提供一种利用Unicode解决专利资料多语言文字显示的方法及系统,该发明通过在应用服务器中将二进制数据流转换为Unicode字符流,取代了在客户机上安装编码转换软件的方法。该系统包含至少一客户机,用于下载远程专利数据库中的资料或查阅本地专利数据库中的资料;至少一应用服务器,用于连接客户机与中央数据库,并提供客户机与中央数据库间Unicode字符流与二进制数据流的相互转换;至少一与应用服务器相连的中央数据库,用于存放下载的专利资料。
本发明达成专利多语言显示的目的是通过对应用服务器的操作实现的。在中央数据库将专利资料传送到应用服务器的数据处理端口后,该端口调用操作系统的字符转换服务,将二进制数据流转换为Unicode字符流,放入应用服务器缓存,然后传送到客户机,在客户机应用软件上专利资料就能正确显示。
通过本发明,避免了由于不同的系统设置所产生的在客户机中出现乱码的问题,实现了在客户机中正确显示专利资料的目的,同时也避免了在客户机安装不必要的编码转换软件。

图1是本发明专利资料多语言文字显示方法及系统的适用环境示意图。
图2是本发明专利资料多语言文字显示方法及系统的客户机结构图。
图3是本发明专利资料多语言文字显示方法及系统的应用服务器结构图。
图4是本发明专利资料多语言文字显示方法及系统的中央数据库结构图。
图5~图7是本发明专利资料多语言文字显示方法及系统的作业流程图。
具体实施方式如图1所示,是本发明专利资料多语言文字显示方法及系统的适用环境示意图。在该环境中包含至少一客户机10、至少一应用服务器12、至少一中央数据库13以及将它们相连的企业内部网11。随着互联网的发展,世界各国专利局都设置了网上专利数据库,其存有各种专利信息,供公众查阅。客户机10可以下载互联网专利资料,它将专利资料下载并存储于中央数据库13中,通过它用户还可以查阅、分析中央数据库13中的专利资料。应用服务器12是客户机与中央数据库13的连接设备,通过它可把专利资料存储到中央数据库13中,同样,当客户机10需要读取中央数据库13中的专利资料时,也必须调用应用服务器12提供的服务。中央数据库13中的专利资料均以二进制数据形式存在。
如图2所示,是本发明专利资料多语言文字显示方法及系统的客户机结构图,它可以连接到例如互联网服务提供商(Internet Service Provider,ISP)的网络、企业内部网(Intranet)或者互联网(Internet),可以通过互联网从各国专利数据库下载各种不同语言编码的专利资料,并将专利资料传送至应用服务器12,经一系列处理,最后存放于中央数据库13,该处理过程在下文有进一步介绍。在客户机10中,包含一浏览器21,其可以为Microsoft公司的Internet Explorer,它能自动调用操作系统的服务将从互联网专利数据库下载的不同语言编码的专利资料转换为Unicode字符流;一应用软件22(客户端),通过它调用浏览器21进行专利资料的下载、传送及显示,它还可以显示中央数据库13中的专利资料目录、提供专利资料分析的工具,以及向中央数据库13发送专利资料查阅请求。
在本发明的另一实施例中(此图未画出),客户机可只包含一应用软件,而不包含浏览器,应用软件可根据用户下载条件发送相应Javascript语句至HTTP(超文本传输协议)网络代理(该网络代理能够向互联网资源发送请求及接收互联网资源的回答),直接下载远程专利数据库中的专利资料,并调用操作系统的服务将下载的专利资料转换为Unicode字符流。
如图3所示,是本发明专利资料多语言文字显示方法及系统的中央服务器结构图。由于Unicode编码是以字符的形式存在的,而在中央数据库13中,所有的存取操作都是基于二进制数据的,因此在专利资料存入数据库时必须把Unicode字符转换成二进制数据。而在专利数据读取时,二进制数据也必须转换为Unicode字符。本发明中的应用服务器12,即提供该种编码转换的服务,其包含一数据处理端口31(或可称为服务器端应用软件),该数据处理端口31是在服务器操作系统32之上,用于接收客户机10及中央数据库13传送过来的数据,同时也可接收客户机10的专利资料查阅请求,并生成数据库查询语句,并将查询语句传递到中央数据库13执行。在数据处理端口31处理二进制数据流过程中,数据处理端口31将调用应用服务器12的操作系统32提供的服务。首先,数据处理端口31在收到客户机10发送的Unicode字符流后,调用操作系统32的二进制转换服务33,将Unicode字符流转换为二进制数据流,而应用服务器12的操作系统32的语言设置则作为转换的一个参数,被记录于二进制数据流中。然后二进制数据流被推入应用服务器12的系统缓存35。最后二进制数据流经数据库驱动器36被传输到中央数据库13,并被存储到专利数据库41中。而专利资料查阅的过程则相反。在接收到中央数据库13发送的二进制数据流后应用服务器12调用其操作系统32的字符转换服务34,将二进制数据转换为Unicode字符,然后发送给客户机10。
如图4所示,是本发明专利资料多语言文字显示方法及系统的中央数据库结构图。在中央数据库13中,包含有专利数据库41,它存放有二进制数据格式存放的专利资料。中央数据库13可以执行由应用服务器12生成的数据库查询语句,用以查阅其中的专利资料。
如图5、图6及图7所示,是本发明专利资料多语言文字显示方法及系统的作业流程图。首先用户在客户机10向应用软件22发出请求(步骤S51),该请求可能为向专利数据库41存储专利资料,也可能为查阅专利数据库41中已存在的专利资料。应用程序22随即将请求发送到应用服务器12的数据处理端口31(步骤S52),数据处理端口31判断该请求是否为查阅请求(步骤S53)。若非查阅请求,则推定其必为专利资料存储请求,如图6所示,数据处理端口31调用操作系统32的二进制转换服务33(步骤S61),将Unicode字符流转换为二进制数据流,并把该二进制数据流放入系统缓存35(步骤S62),然后数据库驱动器36将系统缓存35内的二进制数据流传送至中央数据库13(步骤S63),最后二进制数据流被存入中央数据库13的专利数据库41中(步骤S64)。若为查阅请求,则如图7所示,数据处理端口31生成一数据库查询语句(步骤S71),并将查询语句传送至中央数据库13(步骤S72),中央数据库13执行该查询语句(步骤S73),在专利数据库41中查找相应专利资料。查得的专利资料以二进制数据流的形式被发送到应用服务器12的数据处理端口31(步骤S74),数据处理端口31调用操作系统32的字符转换服务将二进制数据流转换为Unicode字符流(步骤S75),然后将其送至客户机10的应用软件22显示用户所需的专利资料(步骤S76)。
权利要求
1.一种专利资料多语言文字显示系统,其特征在于,在应用服务器中将二进制数据流转换为Unicode字符流,使不同系统设置所产生的不同编码标准的专利资料可以正确显示,该系统包含有至少一与互联网相连的客户机、至少一应用服务器及至少一中央数据库,其中客户机用于从互联网下载专利资料及供用户查阅中央数据库中的专利资料,其包含有一应用软件,该应用软件可以下载互联网上的专利资料,该应用软件可向应用服务器发送对中央数据库中专利资料进行存储或查阅的请求,并可以显示Unicode字符;应用服务器与客户机及中央数据库相连接,其包含一数据处理端口,该数据处理端口可以通过应用服务器提供的二进制转换服务及字符转换服务,将二进制数据流与Unicode字符流互相转换;中央数据库用于存储下载的专利资料。
2.如权利要求1所述的专利资料多语言文字显示系统,其特征在于,其中客户机可以包含一浏览器,应用软件可以调用浏览器下载互联网上的专利资料。
3.如权利要求1所述的专利资料多语言文字显示系统,其特征在于,其中应用软件可以提供中央数据库中所存储专利资料的目录。
4.如权利要求1所述的专利资料多语言文字显示系统,其特征在于,其中应用软件可以接受用户输入的专利资料下载条件,以下载互联网上的相关专利资料。
5.如权利要求1所述的专利资料多语言文字显示系统,其特征在于,其中应用软件能够将专利资料查阅请求传送至应用服务器的数据处理端口。
6.如权利要求1所述的专利资料多语言文字显示系统,其特征在于,其中应用软件能够接受数据处理端口传回的专利资料并显示于客户机。
7.如权利要求1所述的专利资料多语言文字显示系统,其特征在于,其中数据处理端口能根据所接收的专利资料查阅请求,生成数据库查询语句。
8.一种专利资料多语言文字显示方法,其特征在于在应用服务器中将二进制数据流转换为Unicode字符流,使不同系统设置所产生的不同编码标准的专利资料可以正确显示,该方法包含的步骤为(a)中央数据库将用户所查阅的专利资料以二进制数据流的形式发送到应用服务器;(b)应用服务器将所接收到的专利资料由二进制数据流转换为Unicode字符流;(c)应用服务器将专利资料以Unicode字符流的形式发送到客户机,以显示专利资料。
9.如权利要求8所述的专利资料多语言文字显示方法,其特征在于,其中步骤(b)的转换过程为数据处理端口接收二进制数据流,然后通过操作系统的字符转换服务将二进制数据流转换为Unicode字符流,并将转换后的Unicode字符流传送入系统缓存。
10.如权利要求8所述的专利资料多语言文字显示方法,其特征在于,其中步骤(c)包含应用服务器系统缓存将其中的Unicode字符流传送到客户机的应用软件的步骤。
全文摘要
一种专利资料多语言文字显示方法及系统,通过在应用服务器中将二进制数据流转换为Unicode字符流,从而可在客户机正确显示不同语言编码的专利资料。该系统包含至少一客户机、至少一应用服务器和至少一与服务器相连的中央数据库。其解决了客户机与应用服务器间由于不同语言编码设置导致的中央数据库中的专利资料在客户机上显示为乱码的问题。
文档编号G06F3/14GK1452058SQ0211513
公开日2003年10月29日 申请日期2002年4月20日 优先权日2002年4月20日
发明者李忠一, 罗才洋, 段修明 申请人:鸿富锦精密工业(深圳)有限公司, 鸿海精密工业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1