本申请涉及计算机技术领域,特别是基于信息安全的贷前审批方法、系统、设备和存储介质。
背景技术:
信贷审批是主管信贷业务的人员在规定的审批权限内,依据借款申请书和贷前调查意见,进行“认定事实,掌握政策,确定贷款”的过程。认定事实,即审批人对企业和申请人提供的贷款原因进行复审,正确判定其性质。掌握政策,以认定的事实为依据,根据国家和上级银行确定的信贷政策,最终确定贷与不贷,贷多贷少的意见。确定贷款,主要是决定贷款数额,还款期限、利率和贷款方式。
目前很多贷款平台在进行贷款审批时,需要人工收集客户各种数据,申请人把资料准备好后提交给贷款公司或银行的系统里面,系统再把相关资料分配给专门的人员。专门的人员去收集申请人的各种信贷信息,如去法院网收集申请人或申请人所在单位是否涉诉等相关信息,去工商网收集申请人所在单位的真实性和合法性,以及申请人所在单位是否正常运营等相关信息,对申请人提供的所有电话通过网络进行信用查询,对申请人所有银行账户进行信用查询,还需对申请人及其亲属、同事进行电话核实,通过电话核实接听者与申请人之间的关系及核实申请人提交资料的相关基础信息。
可见,现有的信贷审批过程需要浪费大量的人力物力去线下收集资料,不能及时对申请人的信贷等级作出反馈,浪费客户的等待时间,信贷审批周期长且效率低。
技术实现要素:
基于此,有必要针对现有的信贷审批方法消耗人力物力、审批效率低等问题,提供基于信息安全的贷前审批方法、系统、设备和存储介质。
一种基于信息安全的贷前审批方法,包括:接收申请人上传的信贷申请材料,依据所述信贷申请材料采用网络爬虫从征信平台中爬取所述申请人的多项违信行为的违信次数;分别依据各项所述违信行为的所述违信次数,计算各项所述违信行为所对应的信用值;对各项所述违信行为所对应的所述信用值进行求和,得到求和结果,依据所述求和结果对所述信贷申请材料进行审批。
在一个实施例中,所述依据所述信贷申请材料采用网络爬虫从征信平台中爬取所述申请人的多项违信行为的违信次数,包括:从所述信贷申请材料中获取所述申请人的身份信息;连接所述征信平台的数据库;依据所述身份信息查询所述征信平台的数据库;通过所述网络爬虫爬取各项所述违信行为的所述违信次数。
在一个实施例中,所述分别依据各项所述违信行为的所述违信次数,计算各项所述违信行为所对应的信用值,包括:依据所述违信行为对应的信用级别分别为所述违信行为设置相应的违信权值;将所述违信行为的所述违信次数与所述违信权值进行相乘,得到所述违信行为所对应的所述信用值。
在一个实施例中,所述依据所述求和结果对所述信贷申请材料进行审批,包括:设置信贷审批合格阈值;将所述求和结果与所述信贷审批合格阈值进行比较;若所述求和结果大于所述信贷审批合格阈值,则判定所述信贷申请材料未通过审批;若所述求和结果小于所述信贷审批合格阈值,则判定所述信贷申请材料通过审批。
在一个实施例中,所述从所述信贷申请材料中获取所述申请人的身份信息,包括:从所述信贷申请材料中获取所述申请人的证件图像;通过证件图像掩膜从所述证件图像中裁取身份信息区域图像;对所述身份信息区域图像进行二值化处理,得到二值化图像;对所述二值化图像进行文字识别,得到所述身份信息。
在一个实施例中,所述对所述身份信息区域图像进行二值化处理,得到二值化图像,包括:分别计算所述身份信息区域图像中每个像素点的三基色rgb的平均值;将每个所述平均值作为所述身份信息区域图像中对应像素点的灰度值,得到灰度图像;对所述灰度图像进行背景噪声滤除,得到降噪图像;以所述降噪图像的灰度平均值为二值化阈值,根据所述二值化阈值对所述降噪图像进行二值化处理,得到所述二值化图像。
在一个实施例中,所述对所述二值化图像进行文字识别,得到所述身份信息,包括:从左往右搜索所述二值化图像中单字符的左右界,切分出所述单字符所对应的单字符图像;从所述单字符图像中提取所述单字符的字符特征信息;通过字符分类器依据所述字符特征信息对所述单字符进行识别,得到单字符信息;将各所述单字符信息按初始的排列顺序进行组合,形成所述身份信息。
基于相同的技术构思,本申请还提供了一种基于信息安全的贷前审批系统,所述系统包括包括获取模块、计算模块、审批模块。
所述获取模块,设置为接收申请人上传的信贷申请材料,依据所述信贷申请材料采用网络爬虫从征信平台中爬取所述申请人的多项违信行为的违信次数。
所述计算模块,设置为分别依据各项所述违信行为的所述违信次数,计算各项所述违信行为所对应的信用值。
所述审批模块,设置为对各项所述违信行为所对应的所述信用值进行求和,得到求和结果,依据所述求和结果对所述信贷申请材料进行审批。
基于相同的技术构思,本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述基于信息安全的贷前审批方法的步骤。
基于相同的技术构思,本申请还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述基于信息安全的贷前审批方法的步骤。
与现有机制相比,本申请的实例中,采用网络爬虫从征信平台中爬取申请人违信行为的数据,对违信行为的数据的各项信用评定参数的信用值进行求和,得到求和结果,依据求和结果对信贷申请材料进行审批,实现了信贷申请的线上自动审批,降低了信贷审批的人力成本、提高了信贷审批效率。
附图说明
通过详细阅读下文实施方式的详细描述,各种其他的有点和益处对于本领域内普通技术人员将变得清楚明了。附图仅用于示出可选实施方式的目的,而并不认为是本申请的限制。
图1为本申请一个实施例中一种基于信息安全的贷前审批方法的流程图;
图2为本申请一个实施例中获取违信行为的数据步骤的流程图;
图3为本申请一个实施例中计算信用值步骤的流程图;
图4为本申请一个实施例中信贷审批步骤的流程图;
图5为本申请一个实施例中一种基于信息安全的贷前审批系统的示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可以包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、程序、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、程序、步骤、操作、元件、组件和/或它们的组。
图1为本申请一个实施例中一种基于信息安全的贷前审批方法的流程图,具体的,该方法可由贷前审批设备执行,贷前审批设备可以为后台服务器。如图1所示,所述基于信息安全的贷前审批方法,可以包括如下步骤s1-s3:
步骤s1、获取违信次数:接收申请人上传的信贷申请材料,依据所述信贷申请材料采用网络爬虫从征信平台中爬取所述申请人的多项违信行为的违信次数。
申请人通过客户端的线上信用贷款界面为贷前审批的后台服务器提供信用贷款所需要的信贷申请材料(或者通过线上信用贷款界面填写信用贷款所需要的信贷电子申请表)。信贷申请材料包括以下信息:身份信息、贷款金额和贷款原因等。信用贷款所需要的电子材料准备完毕后,线上信用贷款界面弹出提示确认申请贷款的确认框,申请人点击“确认”按钮后,上传信贷申请材料并发出信贷请求。所述线上信用贷款界面包含h5页面或web页面。
违信行为包含手机号未实名认证行为、手机号欠费行为、信用卡欠费行为、网贷平台中的违约行为、网贷平台中的逾期行为、政府法院网站中记录的法律仲裁、第三方平台中记录的的违法行为、第三方平台中记录的工商违信行为。征信平台对个人的各项违信行为的违信次数做有记录。
如图2所示,在一个实施例中,步骤s1包括以下步骤s11-s14:
s11:从所述信贷申请材料中获取所述申请人的身份信息。
所述身份信息用于识别申请人的身份,包括申请人的公民身份号码。通过向征信平台输入被查询的申请人的公民身份号码,对申请人的信用信息进行查询。在其它实施例中,身份信息还包括申请人的姓名、出生日期、家庭住址、学历、工作情况、联系人信息、银行卡号、手机号或婚姻状况。
在一个实施例中,申请人的身份信息可以通过扫描相关证件的方式获取,可以节省输入身份信息的操作时间。具体地,步骤s11包括以下步骤s111-s114:
s111:从所述信贷申请材料中获取所述申请人的证件图像。
在一个实施例中,所述证件包括居民身份证、驾驶证等可以唯一识别申请人身份的证件。通过调用客户端的相机模块,对申请人的证件进行扫描,获取相应的证件图像。
s112:通过证件图像掩膜从所述证件图像中裁取身份信息区域图像。所述身份信息区域图像含有所述身份信息。
图像掩膜用于裁剪出图像中感兴趣的区域。本申请中,证件图像掩膜的大小与证件尺寸大小相一致。证件图像掩膜隐去证件图像中背景区域,保留图像中感兴趣的身份信息的区域。证件中,属于身份信息的区域是固定的,因此,证件图像掩膜容易制作,确定证件图像中身份信息的区域位置,制作相应的证件图像掩膜,通过证件图像掩膜将证件图像中属于身份信息的区域同逻辑‘1’进行与运算,保留有兴趣的信息,将证件图像中属于身份信息的区域同逻辑‘0’进行与运算,隐去背景信息。例如,制作与居民身份证图像相应大小的证件图像掩膜,通过证件图像掩膜对居民身份证图像中公民身份号码区域进行裁取。
s113:对所述身份信息区域图像进行二值化处理,得到二值化图像。
图像二值化的目的是最大限度的将图象中感兴趣的部分保留下来。获取的证件图像一般为彩色的,经过图像掩膜裁取后,得到身份信息区域图像。身份信息区域图像经过二值化后,图像只剩下两种颜色,即黑和白,其中一个颜色用作图像的背景,另一个颜色就是要识别的文字,这样大大减少了文字处理的计算量。
在一个实施例中,步骤s113包括以下步骤s1131-s1133:
s1131:分别计算所述身份信息区域图像中每个像素点的三基色rgb的平均值;将每个所述平均值作为所述身份信息区域图像中对应像素点的灰度值,得到灰度图像。
图像的灰度化处理是将彩色图像转化成为灰度图像的过程。彩色图像中的每个像素点的颜色由r(红)、g(绿)、b(蓝)三个基本分量(三基色)决定,而每个分量有256种值可取,这样一个像素点可以有1600多万(256*256*256)的颜色的变化范围。而灰度图像是r、g、b三个分量相同的一种特殊的彩色图像,其一个像素点的变化范围为256种,所以将各种格式的图像转变成灰度图像以使后续的图像的计算量变得少一些。灰度图像的描述与彩色图像一样仍然反映了整幅图像的整体和局部的色度和亮度等级的分布和特征。
本申请,将每个像素点的三基色rgb的平均值作为该像素点的灰度值,实现身份信息区域图像的灰度化处理。
s1132:对所述灰度图像进行背景噪声滤除,得到降噪图像。
通过邻域像素算法判别所述灰度图像的背景噪声。设置灰度阈值,对于所述灰度图像中灰度值超过灰度阈值的邻域像素点,判别为背景色;如果一个像素点的上下左右4个像素点有超过2个的像素点属于背景色,那么该像素点就是背景噪声。去除背景噪声,使得所述灰度图像的文字排除背景干扰,更加容易识别。
s1133:以所述降噪图像的灰度平均值为二值化阈值,根据所述二值化阈值对所述降噪图像进行二值化处理,得到所述二值化图像。
计算出所述降噪图像中各像素点的灰度值的平均值;以该平均值作为二值化阈值,将所述降噪图像中灰度值小于二值化阈值的像素点的灰度值设置为0,将所述降噪图像中灰度值大于二值化阈值的像素点的灰度值设置为255,得到身份信息区域图像的黑白图像。
s114:对所述二值化图像进行文字识别,得到所述身份信息。
文字识别采用光学字符识别(opticalcharacterrecognition),通过检测暗、亮的模式确定身份信息区域图像上文字形状,然后用字符识别的方法把形状翻译成计算机文字的过程。
在一个实施例中,步骤s114包括以下步骤s1141-s1144:
s1141、字符切割:从左往右搜索所述二值化图像中单字符的左右界,切分出所述单字符所对应的单字符图像。
通常,申请人的某种可以识别身份的个人身份信息是在同一行的,例如居民身份证中的公民身份号码。通过前述图像掩膜裁取居民身份证图像中的公民身份号码区域图像后,直接对民身份号码区域图像进行字符切割,切分出单字符图像。其中,单字符包括文字、数字、字母、标点符号等。
s1142、提取字符特征信息:从所述单字符图像中提取所述单字符的字符特征信息。
字符特征信息包括字符的中心位置、笔画方向、端点、交点、折点、行或列前景像素数目、笔画分布状况等。
s1143、字符分类识别:通过字符分类器依据所述字符特征信息对所述单字符进行识别,得到单字符信息。
每个不同的字符都能通过特征来和其他字符进行区分,依据字符特征信息对各单字符进行识别。
字符分类器是用来进行文字识别的,依据单字符图像中的字符特征信息判断该单字符应该识别成哪个字。在进行实际识别前,对字符分类器进行训练,人工选取一定量的单字符图像样本,对各单字符图像样本做相应的结果标注,将做有结果标注的单字符图像样本的字符特征信息输入到字符分类器中,进行字符识别训练。
字符分类器将单字符图像的字符特征信息与字典字符信息进行相关度识别,取相关度最大的字典字符作为字符识别的结果;具体计算公式如下:
其中,r表示相关度,s(x,y)表示单字符图像的字符特征信息,m(x,y)表示字典字符信息,width、height分别表示单字符图像的宽度和高度,t表示一预设的阈值;|s(x,y)-m(x,y)|<t?1∶0表示当|s(x,y)-m(x,y)|小于t时,取值为1,否则,取值为0。
如果r为1,则说明单字符图像的字符特征信息与字典字符信息完全匹配;如果r为0,则说明单字符图像的字符特征信息与字典字符信息没有相关性;取相关度最大的字典字符作为字符识别的结果。
s1144、组合成身份信息:将各所述单字符信息按初始的排列顺序进行组合,形成所述身份信息。
各单字符被识别出来后,按单字符初始的排列顺序进行组合,便恢复出了身份信息。例如,通过字符分类器识别出公民身份证的每个公民身份号码数字后,按序将这些数字进行组合,就得到了申请人的公民身份号码。
s12:连接所述征信平台的数据库。
s13:依据所述身份信息查询所述征信平台的数据库。
获得征信平台的数据连接端口权限,输入申请人的身份信息后,从数据连接端口接入到征信平台的数据库,用以查询相应的信息。
现有的征信平台有很多,现有征信平台包含网贷平台、政府法院网站和第三方平台等,所述网贷平台爬取的数据包含申请人在该网贷平台对外公开的违约和预期记录,所述政府法院网站爬取的数据包含申请人的法律仲裁情况,所述第三方平台爬取的数据包含申请人的真实性和信用报告,所述第三方平台包含前海征信和启信宝,所述前海征信和启信宝的信用数据来源于公安网或工商局、人行征信。购买征信平台的接口权限后,便可以在征信平台上爬取数据。征信平台属于现有技术,在此不再累述。
s14:通过所述网络爬虫爬取各项所述违信行为的所述违信次数。
网络爬虫又被称为网页蜘蛛、网络机器人,在foaf社区中间,更经常的称为网页追逐者,是一种按照一定的规则自动的爬取万维网信息的程序或者脚本,另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
网络爬虫是一个自动提取网页的程序,一般分为普通爬虫和聚焦爬虫。网络爬虫技术常应用于搜索引擎中,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。所述网络爬虫从一个或若干初始网页的url开始,获得初始网页上的url,在抓取网页的过程中,不断从当前页面上抽取新的url放入队列,直到满足系统的一定停止条件。
步骤s2、计算信用值:分别依据各项所述违信行为的所述违信次数,计算各项所述违信行为所对应的信用值。
申请人的某一违信行为的违信次数越多,说明申请人在该违信行为方面的信用度就越低。例如,如果申请人的信用卡欠款记录的次数越多,那么说明申请人在使用信用卡方面的信用度也就越低。
违信行为反映了申请人是否命中失信公告信息、是否命中执行公告信息、是否命中股权出质记录、是否命中相关法院被执行人记录、是否命中相关法院失信人记录以及是否命中裁判文书等情况。
如图3所示,在一个实施例中,步骤s2包括以下步骤s21-s22:
s21:依据所述违信行为对应的信用级别分别为所述违信行为设置相应的违信权值。
违信权值反映了评估申请人违信行为的重要程度;违信行为的违信权值越大,说明该违信行为对申请人信用度的影响程度越大。不同项的违信行为所反映的申请人信用的程度是不一样的;例如,一般的,申请人手机号欠费情况对申请人信用影响较少,因此,对手机号欠费情况的评估标准需要宽松一些,将手机号欠费情况的违信权值设置的小一些;而申请人贷款违约等情况对申请人信用影响很大,因此,对申请人贷款违约情况的评估标准需要严格一些,将申请人贷款违约情况的违信权值设置的大一些。
对于不同的申请人而言,各项违信行为有的可能发生违信情况,有的可能未发生违信情况,违信行为的违信次数也有可能不同。某项违信行为,申请人违信的次数越多,说明该申请人在此项违信行为的信用度越低。因此,对各项违信行为的违信次数进行统计,用以反映该申请人在此项违信行为的信用度。
s22:将所述违信行为的所述违信次数与所述违信权值进行相乘,得到所述违信行为所对应的所述信用值。
通过违信权值及违信次数反映违信行为的信用度。
步骤s3、信贷审批:对各项所述违信行为所对应的所述信用值进行求和,得到求和结果,依据所述求和结果对所述信贷申请材料进行审批。
对各项违信行为的数据相应的信用分数进行加和运算,得到总的信用值。依据总的信用值对申请人的信贷风险进行评估,得到申请人的信贷审批结果。
如图4所示,在一个实施例中,步骤s3中所述依据所述求和结果对所述信贷申请材料进行审批,包括以下步骤s31-s32:
s31:设置信贷审批合格阈值。
信贷审批合格阈值用于依据信用值的求和结果衡量申请人的信用度是否符合信贷要求。
s32:将所述求和结果与所述信贷审批合格阈值进行比较;若所述求和结果大于所述信贷审批合格阈值,则判定所述信贷申请材料未通过审批;若所述求和结果小于所述信贷审批合格阈值,则判定信贷申请材料通过审批。
例如,将信贷审批合格阈值设为0.5,所述求和结果若为0.41,则信贷申请材料通过审核。
上述实施例,采用网络爬虫从征信平台中爬取申请人的各项违信行为的违信次数,依据违信次数得到各项违信行为的信用值,对各项违信行为的信用值进行求和,得到求和结果,依据求和结果对信贷申请材料进行审批,实现了信贷申请的线上自动审批,降低了信贷审批的人力成本、提高了信贷审批效率。
基于相同的技术构思,本申请还提供了一种基于信息安全的贷前审批系统,如图5所示,该系统包括获取模块、计算模块、审批模块。
所述获取模块,设置为接收申请人上传的信贷申请材料,依据所述信贷申请材料采用网络爬虫从征信平台中爬取所述申请人的多项违信行为的违信次数。
所述计算模块,设置为分别依据各项所述违信行为的所述违信次数,计算各项所述违信行为所对应的信用值。
所述审批模块,设置为对各项所述违信行为所对应的所述信用值进行求和,得到求和结果,依据所述求和结果对所述信贷申请材料进行审批。
上述实施例,采用网络爬虫从征信平台中爬取申请人的各项违信行为的违信次数,依据违信次数得到各项违信行为的信用值,对各项违信行为的信用值进行求和,得到求和结果,依据求和结果对信贷申请材料进行审批,实现了信贷申请的线上自动审批,降低了信贷审批的人力成本、提高了信贷审批效率。
基于相同的技术构思,本申请还提出了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述各实施例中的所述基于信息安全的贷前审批方法的步骤。
基于相同的技术构思,本申请还提供了一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述各实施例中的所述基于信息安全的贷前审批方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)等非易失性存储介质,或随机存储记忆体(randomaccessmemory,ram)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。