专利名称:一种识别网站内容非授权更改的方法和系统的制作方法
技术领域:
本发明涉及网站安全运行的技术,尤其涉及一种实现监控和识别网站内容的非授 权更改的方法与系统。
背景技术:
一个网站的运行,对于一些关键部门的网站而言,由于发布信息具有权威性、严肃 性、唯一性以及不容篡改性等基本要求,同时,这些网站的连续可用性也是社会各界关注的 焦点,对于这些至关重要的网站,如何能做到监控和识别网站内容是否非授权更改,即网站 被篡改的察觉,就成为了当前众多网站运行中遇到的棘手问题。当前使用的防篡改系统,实 现方法众多,但大多需要安装相应软件或硬件,这些软、硬件设备通过一定的预存储技术、 各种比对算法技术、水印识别技术等等,来实现各个级别的内容篡改的察觉,之后驱动各种 隔离、恢复和应急内容提供等技术系统的运行,来完成相应工作。这些系统由于实时运行, 或并机工作,或成为整个网页输出到用户浏览器整个过程中的一部分,从需要增加软、硬设 备投入的造价成本,到软硬件消耗系统资源的成本,以及增加设备摆放空间成本和用户在 获取内容过程中付出的时间等待成本等,都各有不同程度略势,因此不能实现大范围应用。
发明内容
本发明的目的在于解决上述问题,提供了一种可实现低成本、大范围应用的监控 网站内容非授权更改的方法与系统。本发明的另一目的在于提供了一种实现网站容灾容错和防篡改运行的方法。本发明的技术方案为本发明揭示了一种识别网站内容非授权更改的方法,包括 一个网站监控中心,依照预先设定的规则执行一组两个以上的网页检查任务,在获得了每 个网页的属性、状态、内容数据,以及所述数据是否改变的逻辑判断值后,再依据针对该组 任务的逻辑运算规则进行逻辑运算,该逻辑运算返回值触发执行后续的程序,或对外发送 出对应的指令。上述的识别网站内容非授权更改的方法,其中,网站监控中心检查一组任务过程 中,对每个不同网页的属性、内容、状态做数据记录,该记录包括文件属性、返回状态、连接 可用性、读取可用性、网页内容值、文件大小、出现特定关键字、出现特定内容等。监控中心 将本次数据记录与上次存储之数据记录做比对、分析、判断,从而获得这些记录的是否改变 的逻辑判断值。上述的识别网站内容非授权更改的方法,其中,网站监控中心依据每个网页的数 据记录和逻辑判断值,再次进行针对该组任务进行表述的逻辑表达式的运算,该运算返回 该组检查任务的成功或失败的逻辑值。该逻辑运算值确定不同的后续程序运行或对外发送 相应指令。上述的识别网站内容非授权更改的方法,其中,该监控运行系统具有触发后续程 序运行和对外发送指令的能力,包括可启动运行本地程序,或通过网络连接非本机的程序
4使之启动运行,或连接一个网络地址和端口以使之做出运行响应等。本发明由于将逻辑关系和逻辑运算,置于了整个监控中心检查任务流事件的最外 层,因此可以根据各种返回值组合出很多方案,用于识别正常与非正常的关系。继而触发后 续事件的处理。本发明还揭示了一种识别网站内容非授权更改的系统,包括一个以上的网站监控扫描节点系统,该网站监控扫描节点依照预先设定的规则执 行一组两个以上的网页检查任务,在获得了每个网页的属性、状态、内容数据,以及所述数 据是否改变的逻辑判断值后,再根据针对该组任务定义的逻辑运算规则进行逻辑运算,该 逻辑运算返回值触发执行后续的既定程序,或对外发送出对应的指令。一个任务分发管理 中心系统,用于将既定任务队列,分发到各个扫描节点系统中,并用于收集各扫描节点返回 的扫描数据,包括汇总、分析、表列数据、绘制图释、报表等。一个消息处理中心,用于汇总数据,经过核对确认触发通知或命令的行动非误报, 继而触发相应的设备联动,以及触发Email、电话、短信等人员告警通知模块的工作。上述的一种识别网站内容非授权更改的系统,其中,网站监控扫描节点在检查一 组任务过程中,对每个不同网页的属性、内容、状态做记录,这些记录数据包括文件属性、 返回状态、连接可用性、读取可用性、网页内容值、文件大小、出现特定关键字、出现特定内 容等。同时该监控节点将本次检查任务所做记录数据,与上次执行本检查任务时所存储的 相应记录做比对、分析、判断,从而获得这些记录的是否改变的逻辑判断值。上述的一种识别网站内容非授权更改的系统的网站监控扫描节点,在获得了每个 网页的所属记录数值和是否改变的逻辑判断值后,再根据针对该组任务而定义的逻辑表达 式,运算出该组检查任务的逻辑返回值,该逻辑运算返回值确定触发不同的后续程序运行, 或对外发送出相应指令。上述的一种识别网站内容非授权更改的系统,监控扫描节点或消息处理中心核对 数据后,具有依据逻辑运算返回值触发后续程序运行和对外发送指令的能力,包括可启动 运行本地程序,或通过网络连接非本机的程序使之启动运行,或连接一个网络地址和端口 以使之做出运行响应等。本发明对比现有技术有如下的有益效果本发明通过检查网站运行状况的任务 执行,在此检查过程中当出现网页被非授权更改,以及各类其它故障时(电源故障、网络故 障、硬件设施故障、软件程序故障、网站维护中的人为故障、网站高负载运行和系统崩溃、网 站遭黑客攻击、自然灾害等)能够及时察觉问题,并触发相应内部、外部程序运行或设备的 运行,以完成阻挡服务、切换和启用备用服务,或做DNS漂移,或对设备做各种IP地址的重 新分发工作,从而使一个(或一组)网站能够保持连续运行并尽可能少的向访问者展示故 障和错误。本方案较好的解决了位于广域网中的重要部门网站对防篡改、容错、容灾和连续 运行提出的应急保障需求。
图1是本发明一种识别网站内容非授权更改方法的较佳实施例的概述图。图2是本发明识别网站内容非授权更改的方法的另一种实施例的概述图。图3是本发明的识别网站非授权更新的方法的流程示意图。
图4是本发明一种识别网站非授权更新的系统的较佳实施例概述图。图5是本发明一种识别网站非授权更新的方法的较佳实施例流程图。
具体实施例方式下面结合附图和实施例对本发明作进一步的描述。图1示出了实现自动发现网站非授权更新的实施例概述图监控中心SlOl独立设置和运行,通过各种手段对一组网页进行抓取和分析,进而 获得一组对应的属性、状态和网页内容,当对约定的检查任务进行时,可以方便的获得如 最后更新时间、文件大小、服务器返回状态,以及完整的网页内容等,通过与存储的上次检 查时的对应数据做比对,可以方便的获得该网站是否被更新了的逻辑值,即更新与未更新 的判断值。同时另一个检查任务获取到处于另外一台设备或约定网址的某网页内的内容,该 内容可分析提取出一组数值,数值可以是一个当前的时间值和一个时间段值的组合,即准 备更新时,需要登陆一个认证中心,认证中心自动生成包含这两个数值的某网页,而这两个 值就完成了什么时候开始更新内容和需多长时间做完的时间段宣告,该条检查任务将这两 个数值运算出一个时间段值,并与当前标准时间做比对,如果标准时间超出该时间段范围 规定时,则本次任务检查到的网站内容的更新为非授权更新,否则为宣告过的合法更新。通过这些既定逻辑的判断,当判断为非法更新,继而触发S102,开始切换DNS中的 该网站的工作IP地址。DNS服务器S103开始做全网新工作机组的IP地址宣告,来完成全网DNS CACHE服 务器中相应记录的更改及提供这些解析数据给访问者。访问者S104通过获得新的IP地址开始访问应急备份设备提供的WEB服务,而被 篡改的网站,在这一系列触发和IP漂移过程后,将被实质隔离,新用户通过域名访问该网 站将不在获取被篡改内容。关于DNS的工作机制、原理,涉及内容很多且支撑其提供全网服务的设备也众多, 这里仅做大致原理的描述,其工作细节技术已超出本专利描述内容之范围,这里不再赘述。图2示出了实现自动发现网站非授权更新的另一实施例的概述图监控中心S201独立设置和运行,通过各种手段对一组网页进行抓取和分析,进而 获得一组对应的属性、状态和网页内容,当对约定的检查任务进行时,可以方便的获得如 最后更新时间、文件大小、服务器返回状态,以及完整的网页内容等,通过与存储的上次检 查时的对应数据做比对,可以方便的获得该网站是否被更新了的逻辑值,即更新与未更新 的判断值。同时另一个检查任务获取到处于本台设备或网址内的某页面内容,该内容可提取 出某数值,该数值的出现标志着准备正常授权更新,如果未发现该约定数值则认为本次更 新行为是未做宣告的非法更新。通过这些既定逻辑的判断,当判断出非法更新,继而触发S202,通知服务器前端设 备开始阻断或切换工作服务器。访问者S203因此开始获得未被篡改的网站内容,或被阻断访问已篡改内容等。图3示出了实现识别网站非授权更新的方法的工作流程示意图
步骤S301监控中心启动一组任务,做必要数值装填后,进入步骤S302判断扫描任 务队列执行情况,当判断还有扫描任务未执行完毕时,进入步骤S303执行扫描检查任务, 否则进入全任务逻辑运算和判断步骤S307。步骤S303完成一个单独任务的扫描检查工作,这包括但不限于尝试记录连接 性,下载页面内容、性能运算、做任何形式的编码整理和运算。步骤S304使用当前下载到的内容,进行根据预先设定的表达式做关键字检查、或 做某些内容及链接的分析和可用性分析等,并使用当前内容、状态、属性等数据与上次扫描 时的存储数据,根据预先设定的表达式做比对逻辑分析等,获得逻辑结果如是否更新,是 否发现某关键字,是否有头部返回错误,是否有链路错误等等。步骤S305以一定格式或编码存储获取到的内容、状态、属性以及逻辑判断数据 等,已便下次扫描时做比对运算之用。之后进入步骤S302,开始循环执行下一个任务的扫描步骤。当所有扫描任务结束, 开始进入步骤S307做针对整个任务流的逻辑表达式运算,这部分运算将使用到步骤S304 对每个页面的分析数据,步骤S307运算包括但不限于某两个页面的内容是否完全一致, 某页面是否成功获取内容,某页面是否有链路错误,某页面是否有内容检查错误,某页面是 否有返回头部属性错误,以某页面的内容分析出的数值是否与系统时间一致或在一个时间 区间内等等,这些对分属页面的数据进行一个整合的逻辑运算,在步骤S308将获得一个逻 辑值返回,即“真”或“假”,而此逻辑值将触发其后相应的两组程序或指令集步骤S309或步 骤S310的执行。步骤S309和步骤S310可以是任何预设定之程序、命令或指令集,该程序、命令或 指令集将触发位于本地机器、或远端设备和程序服务,使之做出响应等。图4示出了一种识别网站非授权更新的系统的较佳实施例流程图任务分发和管理中心S401,用于用户添加、删除、停止等操作管理扫描任务,任务 分发和管理中心把用户的扫描任务和各种设置定义,以及操作行为分发到分散的各个扫描 节点模块上,使扫描任务以负载均衡到全网的方式运行。—组扫描工作节点S402针对每组任务发起轮询或定时的检查,扫描系统根据对 一组任务中每个网页的属性、状态、数据,以及上次扫描存储的该网页相应数据,根据表达 式计算逻辑返回值或计算基于某算法的求值数据,再将此数据迭代入针对本组扫描任务的 逻辑表达式运算,得出逻辑返回值,当根据定义该逻辑返回值触发了相应通知命令时,扫描 节点将该通知命令迅速上报消息处理中心。消息处理中心S403汇总数据后,经过核对确认本次触发行动非误报,继而触发相 应的设备联动,以及触发Email、电话、短信等人员告警通知模块的工作。图5示出了的一种识别网站非授权更新的方法的较佳实施例流程图监控中心实施一组任务的检查,S501完成对每个网页的检查,并记录其所属的属 性、状态、内容和是否更新的判断值。以S501获得的数据为基础,在S502中做针对整组检查任务定义的逻辑运算表达 式的迭代运算,获得一个针对该任务是否符合条件的判断,依据该判断触发相应后续工作。S503为触发的相应工作,包括报警模块的触发、设备的驱动、远端服务和设备的 响应和动作,或者这些工作的任意组合。
上述实施例是提供给本领域普通技术人员来实现或使用本发明的,本领域普通技 术人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而 本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的 最大范围。
权利要求
一种识别网站内容非授权更改的方法,包括一个网站监控中心,依照预先设定的规则执行一组两个以上的网页检查任务,在获得了每个网页的属性、状态、内容数据,以及所述数据是否改变的逻辑判断值后,再根据针对该组任务定义的逻辑运算规则进行逻辑运算,该逻辑运算返回值触发执行后续的命令、程序、对外发送出调度指令或任意一种组合。
2.根据权利要求1所述的一种识别网站内容非授权更改的方法,其特征在于,网站监 控中心检查一组任务过程中,对每个不同网页的属性、内容、状态做记录,这些记录包括文 件属性、返回状态、连接可用性、读取可用性、网页内容值、文件大小、出现特定关键字、出现 特定内容等。
3.根据权利要求1所述的一种识别网站内容非授权更改的方法,其特征在于,网站监 控中心检查一组任务过程中记录了所属网页的属性、内容、状态等数据,同时将本次检查任 务所做记录数据,与上次执行本检查任务时所存储的相应记录做比对、分析、判断,从而获 得这些记录的是否改变的逻辑判断值。
4.根据权利要求1所述的一种识别网站内容非授权更改的方法,其特征在于,网站监 控中心使用每个网页的所属记录数值和是否改变的逻辑判断值,再根据针对该组任务而定 义的逻辑表达式,运算出该组检查任务的逻辑返回值。
5.根据权利要求1所述的一种识别网站内容非授权更改的方法,其特征在于,网站监 控中心在运算出该组检查任务的逻辑返回值后,依据该逻辑运算返回值执行后续命令、程 序、对外发送出调度指令或任意一种组合。
6.根据权利要求1所述的一种识别网站内容非授权更改的方法,其特征在于,该监控 中心具有依据逻辑运算返回值,触发运行后续命令、程序和对外发送调度指令的能力,包 括运行命令、启动本地程序运行、通过网络连接非本机的程序使之启动运行、连接一个网 络地址和端口以使之做出运行响应、驱动设备等。
7.一种识别网站内容非授权更改的系统,包括一个以上的网站监控扫描节点,该网站监控扫描节点依照预先设定的规则执行一组两 个以上的网页检查任务,在获得了每个网页的属性、状态、内容数据,以及所述数据是否改 变的逻辑判断值后,再根据针对该组任务定义的逻辑运算规则进行逻辑运算,该逻辑运算 返回值触发执行后续的命令、运行程序、对外发送出调度指令或任意一种组合。一个以上的任务分发管理中心,用于将任务队列分发到各个扫描节点系统中,并用于 收集扫描节点返回的数据,包括汇总、核对数据,绘制图释、报表等。
8.根据权利要求7所述的一种识别网站内容非授权更改的系统,其特征在于,网站监 控扫描节点检查一组任务过程中,对每个不同网页的属性、内容、状态做记录,这些记录包 括文件属性、返回状态、连接可用性、读取可用性、网页内容值、文件大小、出现特定关键 字、出现特定内容等。
9.根据权利要求7所述的一种识别网站内容非授权更改的系统,其特征在于,网站监 控扫描节点检查一组任务过程中记录了所属网页的属性、内容、状态等数据,同时将本次检 查任务所做记录数据,与上次执行本检查任务时所存储的相应记录做比对、分析、判断,从 而获得这些记录的是否改变的逻辑判断值。
10.根据权利要求7所述的一种识别网站内容非授权更改的系统,其特征在于,网站监 控扫描节点使用每个网页的所属记录数值和是否改变的逻辑判断值,再根据针对该组任务而定义的逻辑表达式,运算出该组检查任务的逻辑返回值。
11.根据权利要求7所述的一种识别网站内容非授权更改的系统,其特征在于,网站监 控扫描节点在运算出该组检查任务的逻辑返回值后,依据该逻辑运算返回值确定执行后续 的命令、程序、对外发送出调度指令或任意一种组合。
12.根据权利要求7所述的一种识别网站内容非授权更改的系统,其特征在于,该监控 扫描节点或任务分发管理中心,具有依据逻辑运算返回值触发运行后续命令、程序、对外发 送指令的能力,包括运行命令,启动运行本地程序,通过网络连接非本机的程序使之启动 运行,连接一个网络地址和端口以使之做出运行响应、驱动设备等。
全文摘要
本发明是一种识别网站内容非授权更改的方法和系统,完成了大规模实施网站群内容非授权更改的监控需求,通过监控中心自动发现和自动触发动作,可以联动各种报警、切换、阻断等工作,使提高信息安全的防护,特别是防止非授权的篡改行为发生有积极作用。其技术方案为检查一组网页,对每个网页的改变、或是否符合关键字、表达式检查条件等做为基础数据,之后以这些数据为基础,再通过对整组任务定义的逻辑表达式迭代运算,根据该逻辑运算返回值触发联动模块,达到指挥网络设备或服务做出相应动作的目的。本发明用于网络领域。
文档编号H04L12/24GK101931544SQ200910053349
公开日2010年12月29日 申请日期2009年6月18日 优先权日2009年6月18日
发明者张红, 汪海强, 纪明敏, 许晨光, 郭剑波, 郭诺 申请人:上海及第熊软件科技有限公司