Web应用待办与企业门户零耦合集成方法

文档序号:6337763阅读:760来源:国知局
专利名称:Web应用待办与企业门户零耦合集成方法
技术领域
本发明涉及一种Web应用待办与企业门户零耦合集成方法。
背景技术
随着国内经济实力提升,企业的信息系统越来越多,而历史遗留下来的Web应用 也随之增多,用户需要进入原网站才能查看到一些零散的待办消息,带来了诸多不便,故需 要将多个Web应用待办集成到企业门户。TOB应用系统待办集成分为主动和被动两种方式,待办主动集成是指当待办产生 时候立刻反应到企业门户的待办集成库;待办被动集成是指企业门户分析Web应用中的待 办后,将其集成到企业门户待办库中。采用待办主动集成方式必须将对Web应用系统进行改造,待办主动集成方式分为 两种通过硬编码的方式,在数据库层通过触发器方式集成应用系统的待办;在应用层通 过Web Service等远程过程调用方式集成应用系统的待办。若系统源代码或者数据库发生 改动,都不可避免更新待办的集成方式。如果Web应用系统的代码和数据库无法更改,这些 Web应用系统的待办就无法集成到企业门户中,例如历史遗留系统。这些Web应用系统的待办集成只能采用被动的方式。像企业门户这样的外部系统 无法获得C/S结构的Web应用系统的待办,而基于B/S结构的待办网页,可以通过对HTTP 协议响应进行语法分析,将Web应用系统的待办集成到企业门户待办库中。

发明内容
本发明的目的就是提供一种投资少、安全性能高,可提高数据库的更新效率和降 低服务器负载的Web应用待办与企业门户零耦合集成方法。本发明的Web应用待办与企业门户零耦合集成方法,包括三个步骤设置待办规 则库,语法分析,待办信息同步,具体步骤如下
步骤a 确定需要集成Web应用和企业门户待办库之间的对应关系; 步骤b 语法分析引擎处理从Web应用上抓取到的原始待办信息,通过其特征将信息分 别进行缓存,再通过抽取与原始数据接近且适合进一步挖掘的数据,将抽取后的数据信息 再进行数据格式过滤转换,与待办规则库模板进行匹配,最后保存至现门户待办库内,而在 各Web应用系统待办信息上所采用的分析规则也将保存到语法分析引擎规则库中;
步骤c 待办库内信息通过异步交互方式返回到门户页面上,并且那些未处理的待办 信息将高亮显示,用户便可快速获取到有效信息。本发明的Web应用待办与企业门户零耦合集成方法,简化并改进传统的办公待办 信息集成方式,将原页面半结构数据保存至数据库表内,实现数据从半结构化向结构化转 变,与原系统相比具有以下优点
1、不需要单独的对历史遗留网站进行维护与改造,减少投入费用和设计开发周期;
2、独立于应用系统开发,减少系统的耦合度;
33、提供了一种对语句处理的有效策略,增加了办公系统的自动智能化;
4、采用异步通信交互,提高数据库的更新效率和降低服务器的负载,不需要打断用户 的操作,具有更加迅速的响应能力,也不需要下载插件;
5、实际Web应用待办与语法分析结合更能有效的筛选出完整有效的数据信息,提高 效率。


图1为本发明总体架构图。
具体实施例方式一种Web应用待办与企业门户零耦合集成方法,具体步骤 第一部分设置待办规则库
待办规则库存储了集成到企业门户中所有Web应用待办集成规则。该数据库主要包含 了 Web应用特征值(Web应用系统URL)、待办特征值(Web应用系统待办字段串接散列值)、 映射关系(Web应用系统待办字段和企业门户待办字段的对应关系)、以及待办标签名称 (Web应用系统待办网页中包含待办信息的HTML标签名称)。待办规则库中待办标签名称将 在语法分析部分根据分析结果产生,其他字段在此部分根据实际情况设置。第二部分语法分析
本部分主要完成从半结构化的待办网页中得到结构化的待办规则,并将该规则存储到 待办信息抽取模板库内。该过程主要分为抽取、去噪、关键词分析、匹配和存储。1)抽取创建抽取计划,逐个请求有待集成的待办网页,缓存响应后的待办网页至 队列中。2)去噪通过正则表达式对抽取到的内容进行格式匹配,去除与待办网页中待办 信息不匹配的标签;
3)关键词分析利用文档对象分析方法逐个解析去噪后得到的标签,抽取并记录句法 结构中各个关键词,将所有的关键词串接后的散列值(例如MD5)作为该标签的特征值;
4)匹配将该标签的特征值与模板库内的特征值进行匹配,如果找到相一致的特征值, 说明该标签就是需要抽取的待办信息;否则抛弃该标签;
5)存储将相匹配的标签名称和字段对应关系存储在待办集成模板库内。第三部分待办信息同步
如果用户登录企业门户后浏览需要处理Web应用的待办,待办引擎将根据待办特征值 查找待办集成的规则。待办引擎获取规则后,对待办网页的数据分析后获取相应的待办信 息,并缓存至待办库内。待办引擎利用异步交互技术在企业门户中统一展示待办,通过对阅 读标志判断,将未读的待办信息高亮显示。
权利要求
一种Web应用待办与企业门户零耦合集成方法,其特征在于它包括设置待办规则库、语法分析、待办信息同步三个步骤,具体如下步骤a确定需要集成Web应用和企业门户待办库之间的对应关系;步骤b语法分析引擎处理从Web应用上抓取到的原始待办信息,通过其特征将信息分别进行缓存,再通过抽取与原始数据接近且适合进一步挖掘的数据,将抽取后的数据信息再进行数据格式过滤转换,与待办规则库模板进行匹配,最后保存至现门户待办库内,而在各Web应用系统待办信息上所采用的分析规则也将保存到语法分析引擎规则库中;步骤c待办库内信息通过异步交互方式返回到门户页面上,并且那些未处理的待办信息将高亮显示,用户便可快速获取到有效信息。
全文摘要
一种Web应用待办与企业门户零耦合集成方法,区别于传统的主动式待办信息集成,这种方式通过对Web应用待办数据进行语法分析,将这些零散的半结构信息进行数据结构化处理后集成到企业门户待办库中,通过异步交互的方式,将新生成的待办信息高亮显示于企业门户网页中。本发明独立于系统开发,不需要对其他Web应用网站进行改造,实现了模块间的低耦合,这种零入侵的系统接入方式也具有较强的安全性,同时减少投入费用和设计开发周期。本发明还提供对网页结构过滤处理的有效策略,增加了系统的自动智能化;保存各系统不同的待办集成规则,可适应多变的Web应用系统环境。
文档编号G06F17/30GK101976272SQ20101057492
公开日2011年2月16日 申请日期2010年12月7日 优先权日2010年12月7日
发明者李凡, 李庆尧, 王国欢, 赵海峰, 马勇 申请人:江西省电力公司信息通信中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1