本申请涉及计算机领域,特别是涉及一种检测敏感信息的方法和设备。
背景技术:
对于用户的一些敏感信息,例如银行卡号,证件号,联系信息等,不能直接全部显示在网页上,以防止信息泄露导致后续用户被钓鱼,诈骗,威胁用户的账户资金安全,在现有技术中对于整个网站上是否存在这种不符合规范的情况的解决方法如图1所示,用户终端在访问某网站时,所述服务器从数据库中获取相应的数据返回给用户,在返回的过程中对所有的数据进行检测,查看是否包含敏感信息,然后进行记录。
在实现本申请的过程中,发明人发现现有技术至少存在如下问题:
因为对于敏感信息监测的过程是发生在服务器端,且数据监测过程中数据匹配的性能消耗很大,返回的数据量大或大量用户同时访问同一个网站的情况下,会造成明显的延迟,同时对服务器性能的要求也越来越高。随着业务量的不断增长,只能通过增加服务器的方式保障业务的正常运行,大幅增加运营成本。
技术实现要素:
本申请的目的在于提供一种检测敏感信息的方法和设备,本申请通过用户的终端设备对用户访问的网页进行敏感信息的检测,来达到敏感信息泄露点的检测,从而降低了对服务器性能的要求,同时也大幅度降低了运营成本。
一种检测敏感信息的方法,其特征在于,所述方法包括:
终端设备接收服务器根据终端设备的访问请求返回的相应访问网页的数 据信息;
所述终端设备通过自身的浏览器对所述数据信息进行加载生成相应的网页;
所述终端设备根据预先设定的规则库遍历所述网页所对应的超文本标记语言HTML源码进行敏感信息的检测。
所述终端设备根据预先设定的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测,具体为:
所述终端设备调用所述网页上的直译式脚本语言JS,并通过JS脚本中预先设定的敏感信息的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
所述方法还包括:
当所述终端设备根据预先设定的规则库没有检测到敏感信息时,则停止对所述网页的检测;
当所述终端设备根据预先设定的规则库检测到敏感信息时,则将检测到的所述敏感信息相应的信息发送给所述服务器,以使所述服务器根据所述敏感信息相应的信息对所述网页的数据信息进行清洗。
所述敏感信息相应的信息,具体为:
所述敏感信息所对应的网页地址、所述敏感信息的类型和所述敏感信息在所述网页的位置信息。
所述敏感信息在所述网页的位置信息,具体为:
所述敏感信息在所述网页的位置的前后各预定字符个数的代码片段。
一种终端设备,其特征在于,所述设备包括:
接收模块,用于接收服务器根据终端设备的访问请求返回的相应访问网页的数据信息;
加载模块,用于通过自身的浏览器对所述数据信息进行加载生成相应的网页;
检测模块,用于根据预先设定的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
所述检测模块,具体用于:
调用所述网页上的JS脚本,并通过JS脚本中预先设定的敏感信息的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
所述检测模块,还具体用于:
当所述检测模块根据预先设定的规则库没有检测到敏感信息时,则停止对所述网页的检测;
当所述检测模块根据预先设定的规则库检测到敏感信息时,则将检测到的所述敏感信息相应的信息发送给所述服务器,以使所述服务器根据所述敏感信息相应的信息对所述网页的数据信息进行清洗。
所述敏感信息相应的信息,具体为:
所述敏感信息所对应的网页地址、所述敏感信息的类型和所述敏感信息在所述网页的位置信息。
所述敏感信息在所述网页的位置信息,具体为:
所述敏感信息在所述网页的位置的前后各预定字符个数的代码片段。
与现有技术相比,本申请实施例至少具有以下优点:
本申请通过用户的终端设备对用户访问的网页进行敏感信息的检测,来达到敏感信息泄露点的检测,从而降低了对服务器性能的要求,同时也大幅度降低了运营成本。
附图说明
图1为本申请现有技术中中的一种检测敏感信息的方法流程图;
图2为本申请实施例中的一种检测敏感信息的方法流程图;
图3位本申请实施例中的一种检测敏感信息的流程示意图;
图4为本申请实施例中的一种终端设备的结构意图。
具体实施方式
本申请通过终端设备检测自身获取的网页中是否存在敏感信息,来达到检测相应网站中是否存在敏感信息的目的,从而避免用户信息泄露的目的。
下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图2所示,为本申请实施例中一种检测敏感信息的方法,所述方法包括:
步骤201,终端设备接收服务器根据终端设备的访问请求返回的相应访问网页的数据信息。
终端设备在访问某个网页时需要向该网页所对应的服务器发送访问请求,所述服务器根据所述访问请求在其数据库中查找相应的数据信息,并将所述数据信息反馈给所述终端设备。
步骤202,所述终端设备通过自身的浏览器对所述数据信息进行加载生成相应的网页。
步骤203,所述终端设备根据预先设定的规则库遍历所述网页所对应的超文本标记语言HTML源码进行敏感信息的检测。
所述终端设备根据预先设定的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测,具体为:
所述终端设备调用所述网页上的直译式脚本语言JS,并通过JS脚本中预先设定的敏感信息的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
具体的,终端设备的浏览器在接受到所述服务器返回的相应网页的数据信息并对所述数据信息加载完成后,调用网页上的JS,使网页上的JS监控脚本开始运行,其中,在JS监控脚本中包含敏感信息检测的规则库,例如:身份 证号规则、银行卡号规则、手机号规则等有关用户信息的规则,所述JS根据敏感信息检测的规则库遍历所述网页对应的HTML源码来对检测所述网页中是否存在用户的敏感信息。
在遍历所述网页对应的HTML源码后,所述方法还包括:
当所述终端设备根据预先设定的规则库没有检测到敏感信息时,则停止对所述网页的检测;
当所述终端设备根据预先设定的规则库检测到敏感信息时,则将检测到的所述敏感信息相应的信息发送给所述服务器,以使所述服务器根据所述敏感信息相应的信息对所述网页的数据信息进行清洗。
具体的,服务器对敏感信息主要通过数据校验和去重工作进行数据清洗,并对接受到的敏感信息相应的信息存储。
所述敏感信息相应的信息,具体为:
所述敏感信息所对应的网页地址、所述敏感信息的类型和所述敏感信息在所述网页的位置信息。
服务器可以根据敏感信息相应的信息来判断所述敏感信息出现的具体网页的具体位置,以及是何种类型的敏感信息。以使在对敏感信息进行清洗时能够快速准确的找到其位置和确定清洗方案。
所述敏感信息在所述网页的位置信息,具体为:
所述敏感信息在所述网页的位置的前后各预定字符个数的代码片段。
网页中的所有信息都有其对应的代码,所述代码可以表示相应信息的内容、位置等,所述信息的在网页中的位置可以根据其位置的前后特定个数的代码片段来表示,例如,敏感信息所在网页位置前后各20个字符的代码片段,当然据使用多少个字符代码片段可以根据实际情况确定。
与现有技术相比,本申请实施例至少具有以下优点:
本申请通过用户的终端设备对用户访问的网页进行敏感信息的检测,来达到敏感信息泄露点的检测,从而降低了对服务器性能的要求,同时也大幅度降 低了运营成本。
为了进一步阐述本申请的技术思想,现结合具体的应用场景,对本申请的技术方案进行说明,在实际应用中,具体场景的变化并不会影响本申请的保护范围。
在万维网上的一个超媒体文档称之为一个页面,作为一个组织或个人在万维网上开始点的页面称为主页Homepage,或首页,主页中通常包括有指向其他相关页面或其他节点的指针(超级链接)。在逻辑上将视为一个整体的一系列页面的有机集合称为网站(Website或Site)。
HTML源码时一个网页的重要组成部分,一个网页有很多信息,一个网页中的信息是根据HTML源码来进行展示的,HTML源码能够描述相应信息的文字和图片,如:文字如何处理,图片如何安排,图片如何显示等,并且是根据相应信息的出现顺序进行编码的。
如图3所示,终端设备向某个网站的服务器发起访问请求,请求访问该网站下的某个页面,所述服务器根据接收的访问请求查找所述访问请求所对应的网页的数据信息,所述服务器将请求访问的页面的数据信息发送给所述终端设备,所述终端设备通过自身携带的浏览器对所述数据信息进行加载得到相应的页面,所述终端设备通过浏览器调用页面中的JS检测脚本根据JS检测脚本中包含的敏感信息检测的规则库遍历所述页面所对应的HTML源码,检测所述页面是否存在敏感信息。
例如:对当前访问页面中是否存在某个用户的身份证号的检测,所述终端设备调用所述页面中的JS检测脚本根据身份证号规则,如:身份证号的位数、身份证号中的数字排布的规律,以及身份证号制定的规则等遍历当前访问页面的HTML源码,来判断当前访问页面中是否存在某个用户的身份证号。
如果不存在,所述终端设备停止对当前页面的检测;
如果存在,所述终端设备将检测到的敏感信息所在页面的地址、敏感信息的类型和敏感信息所在位置前后各20个字符的代码片段反馈给服务器。
服务器的根据所述敏感信息的所在页面的地址、敏感信息的类型和敏感信息所在位置前后各20个字符的代码片段确定所述敏感信息出现的具体位置,即所述敏感信息出现的具体页面以及出现在具体页面中具体位置,和采用何种类型的清洗规则对所述敏感信息进行清洗,进一步的,根据身份证号的清洗规则对网页中的身份证号进行清洗。
所述服务器对清洗完后的所述页面的数据信息进行保存,以使其他终端设备在访问该网页时保证使终端设备加载后的页面中不会再次出现用户的敏感信息,从而保证了用户敏感信息的安全。
基于与上述方法同样的申请构思,本申请还提出了一种终端设备,如图4所述,该设备包括:
接收模块41,用于接收服务器根据终端设备的访问请求返回的相应访问网页的数据信息;
加载模块42,用于通过自身的浏览器对所述数据信息进行加载生成相应的网页;
检测模块43,用于根据预先设定的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
所述检测模块43,具体用于:
调用所述网页上的JS脚本,并通过JS脚本中预先设定的敏感信息的规则库遍历所述网页所对应的HTML源码进行敏感信息的检测。
所述检测模块43,还具体用于:
当所述检测模块根据预先设定的规则库没有检测到敏感信息时,则停止对所述网页的检测;
当所述检测模块根据预先设定的规则库检测到敏感信息时,则将检测到的所述敏感信息相应的信息发送给所述服务器,以使所述服务器根据所述敏感信息相应的信息对所述网页的数据信息进行清洗。
所述敏感信息相应的信息,具体为:
所述敏感信息所对应的网页地址、所述敏感信息的类型和所述敏感信息在所述网页的位置信息。
所述敏感信息在所述网页的位置信息,具体为:
所述敏感信息在所述网页的位置的前后各预定字符个数的代码片段。
与现有技术相比,本申请实施例至少具有以下优点:
本申请通过用户的终端设备对用户访问的网页进行敏感信息的检测,来达到敏感信息泄露点的检测,从而降低了对服务器性能的要求,同时也大幅度降低了运营成本。
本领域技术人员可以理解实施例中的设备中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式提现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台设备设备(可以是手机,个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本申请的保护范围。
以上公开的仅为本申请的几个具体实施例,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。