本发明涉及面向信用信息服务的数据分析技术领域,特别是涉及一种大数据融合征信平台。
背景技术:
征信体系的起源是为信贷市场服务的,其主要参与者有征信机构、金融机构、企业、个人以及政府。随着时代的发展,特别是为商品交易和劳动力市场提供服务的外延性功能得到进一步加强和扩展,这是市场经济发展的必然。在市场交易信用风险日益显著的背景下,社会信用体系定成为影响一个国家经济发展的重要方面。
目前征信体系模式主要分为三种:第一种是政府主导型模式,又称公共模式或中央信贷登记模式。这种模式是以中央银行建立的“中央信贷登记系统”为主体,兼有私营征信机构的社会信用体系。中央信贷登记系统收集的信息数据主要包括企业信贷信息和个人信贷信息。
据世界银行统计,法国、德国、比利时、意大利、奥地利、葡萄牙和西班牙等七个国家采用公共信用登记机构,即中央信贷登记系统的模式;第二种是市场主导型模式。这种模式是建立在以盈利为目的基础上,由征信机构来收集、加工个人和企业的信用信息,为信用信息的使用者提供独立的第三方服务。在这种体系模式中,政府的作用是促进信用管理立法,监督法律的贯彻执行。
美国、加拿大、英国和北欧等国家大都采用这种社会信用体系模式;第三种是会员制模式。是由行业协会为主建立信用信息中心,为协会会员提供个人和企业的信用信息互换平台,通过内部信用信息共享机制实现征集和使用信用信息的目的。在会员制模式下,会员向信息中心义务提供由会员自身掌握的个人或者企业的信用信息,同时信息中心也仅限于向会员提供信用信息查询服务。信息中心不以盈利为目的,只收取成本费用。日本采用这种信用体系模式。
我国目前有各类征信机构150多家,征信机构主要分三大类:第一类是政府背景的信用信息服务机构20家左右。近年来,各级政府推动社会信用体系建设,政府或其所属部门设立征信机构,接收各类政务信息或采集其它信用信息,并向政府部门、企业和社会公众提供信用信息服务。第二类是社会征信机构50家左右。其业务范围扩展到信用登记、信用调查等。社会征信机构规模相对较小。机构分布与区域经济发展程度相关,机构之间发展不平衡。征信机构主要以从事企业征信业务为主,从事个人征信业务的征信机构较少。征信业务收入和人员主要集中在几家大的征信机构上。第三类是信用评级机构。
目前,纳入相关银行统计范围的信用评级机构共70多家,其中,8家从事债券市场评级业务,收入、人员、业务规模相对较大;其余从事信贷市场评级业务,主要包括借款企业评级、担保公司评级等。
随着互联网与移动互联网的发展,征信系统应用特征也发生了极大的变化,传统的银行征信注重实物资产和债务水平,而互联网征信注重消费数据、频率和地位,其征信体制是完全不同的。我国银行的传统信贷管理体系决定了银行在开展信贷业务时,只能采用资产、债务、现金流水审核方法。从而导致了银行大多数交易数据都躺在银行里面“睡觉”。当电商数据平台崛起之后,银行资金流和数据流开始被分流,大部分商品交易信息流开始转移到电商上,银行慢慢被“后台化”,成为简单的资金提供者和汇兑方,失去了对部分数据的掌握。所以,银行在开展小微信贷和消费信贷等需要交易数据作征信支撑的业务时,就没有电商那么得心应手。尽管目前银行还有开展数据征信的一定条件,但是自己没有用,久之就失去了这种能力。
技术实现要素:
本发明的目的是为了改变传统的对静态历史数据审核与人为评估,提供了一种基于互联网对动态大数据的积累和精确的挖掘分析的大数据融合征信平台,本平台通过数据接口信息交互的方式,访问实有人口库系统和法人库系统的信用基础信息;企业和自然人的社会约束活动信息由相关政府委办局和企事业单位提供,可以通过数据交换和采集的模式,获取各业务主管部门的征信信息;企事业法人和自然人的日常自由活动信息可以由可以通过因特网搜索工具及社交平台获取关法人和自然人的自信息。
本发明所要求解决的技术问题可以通过以下技术方案来实现:
一种大数据融合征信平台,包括数据存储层、逻辑资源层、支撑层、应用层、安全层,所述数据存储层包括数据库服务器、内容服务器、分布式文件系统、非结构数据系统、索引库、元数据,数据存储层是信用信息数据的物理载体;所述逻辑资源层包括法人、自然人信用信息的外部数据库,以及交换至或存储在本地的原材料库、产品库、半产品库、业务规则库、历史存档库、元数据库和资源目录库,逻辑资源层支持各种数据类型的组织和存储;所述支撑层对于不同来源、不同标准的数据统一进行抽取、关联、清洗,最终被加载进入逻辑资源层的原材料库,支撑层提供平台的资源管理和数据交换功能,为服务层提供数据服务支持;所述应用层通过目录服务、文件交换服务、数据库交换服务三种服务方式,实现个人与企业的信用查询、政府监管和消费者投诉维权功能;所述安全层提供数据加密、数据权限、功能权限和认证服务和数据安全服务保证。
进一步地,所述数据存储层还包括物理存储单元。
进一步地,所述支撑层包括节点管理、日志管理、路由管理、数据字典管理、数据接口管理、消息列队管理、资源目录管理、交换策略管理、适配器管理。
进一步地,所述清洗工作不涉及任何对信用信息数据内容本身的新增、修改或删除,而是对数据标准进行加工,以便于数据的组织管理和统一展示。
进一步地,所述平台部署于政务外网和互联网,政务外网的连接通过部署边缘连接设备路由器及安全边缘设备防火墙来实现;互联网的连接同样通过路由器和防火墙来实现,路由器主要实现不同网段的数据路由,防火墙主要通过配置一定的安全策略实现业务系统设备的安全防护。
进一步地,所述政务外网和互联网间通过网闸实现物理隔离,增强政务外网核心系统的安全性,在互联网区部署VPN接入设备,在互联网用户和互联网区设备之间建立加密安全隧道,实现互联网用户的数据安全传输。
本发明的有益效果:一种大数据融合征信平台,易用性好,实现以用户体验为宗旨的操作模式,采用用户自定义及人工智能技术实现和完成数据ETL、共享、交换和查询等功能;易扩展,平台采用云架构存储和管理大数据,支持数据节点的热扩展、热部署、热更新,客户端采用HTML5超文本标记语言实现跨操作系统的用户登录,方便数据管理与用户使用;安全性高,平台在信息来源端采用数据隔离设施,对信息传输及网络采用防火墙等安全措施,对用户登录采用动态认证等方法实现安全管理;可靠传输,安全的消息传输技术,保证数据不丢失,不会出现信息重发现象;灵活的策略配置,支持定时、定次、定时间段执行等策略,支持策略交换和手动交换,支持一对多的数据交换;实时监控,能通过中心对前置机的适配器和消息中间件的状态进行监控,及时了解各节点的运行状态;统一的安全权限认证服务,数据查询和交换必须经过中心认证服务器的统一认证,保证数据的安全性。
附图说明
下面结合附图和具体实施方式对本发明做进一步说明:
图1是本发明大数据融合征信平台结构图。
具体实施方式
为了使本发明技术方案的内容和优势更加清楚明了,下面结合附图对本发明的一种大数据融合征信平台进行进一步描述。
一种大数据融合征信平台,包括数据存储层、逻辑资源层、支撑层、应用层、安全层。数据存储层包括物理存储单元、数据库服务器、内容服务器、分布式文件系统、非结构数据系统、索引库、元数据,数据存储层是信用信息数据的物理载体。逻辑资源层包括法人、自然人信用信息的外部数据库,以及交换至或存储在本地的原材料库、产品库、半产品库、业务规则库、历史存档库、元数据库和资源目录库,逻辑资源层支持各种数据类型的组织和存储。支撑层包括节点管理、日志管理、路由管理、数据字典管理、数据接口管理、消息列队管理、资源目录管理、交换策略管理、适配器管理,支撑层对于不同来源、不同标准的数据统一进行抽取、关联、清洗,最终被加载进入逻辑资源层的原材料库,清洗工作不涉及任何对信用信息数据内容本身的新增、修改或删除,而是对数据标准进行加工,以便于数据的组织管理和统一展示,支撑层提供平台的资源管理和数据交换功能,为服务层提供数据服务支持。应用层通过目录服务、文件交换服务、数据库交换服务三种服务方式,实现个人与企业的信用查询、政府监管和消费者投诉维权功能。安全层提供数据加密、数据权限、功能权限和认证服务和数据安全服务保证。
大数据融合征信平台,从逻辑功能上划分,本平台主要提供三个方面的功能:(1)信用资源服务功能;(2)信用查询和监控服务功能;(3)信用平台管理功能。信用资源服务功能位于平台的支撑层,提供包括数据传输、数据比对转化处理、系统负载均衡、数据交换策略、数据存储和访问等功能。信用查询和监控服务功能提供个人和企事业信用信息查询、政府监管以及消费者投诉维权等应用服务功能。信用平台管理功能提供平台系统后台管理功能,主要包括安全管理和系统运行监控功能。本发明提供一个统一的面向信用信息的大数据共享和交换平台,平台具有良好的信用信息收集和标准化的数据处理手段,并能为业务应用提供可靠的数据服务方式,从而为信用数据的集约化利用提供平台级别的技术支撑。
在现行的信用数据管理体制下,各征信公司主要通过以下渠道获得信用数据:一是通过新闻媒体、互联网等公开的渠道获取;二是通过到被调查企业调查直接获取;三是通过政府部门或有关机构的渠道获取。由于信用信息分散在各部门,互相割裂垄断,不能共享,加上信用信息应用领域的不断扩大,造成了信用数据逐渐变得庞大、数据类型也复杂多样,不仅包含结构化数据,也包括图片、文本、音视频等大量的非结构化数据,传统的关系型数据库架构已经难于支持信用信息数据经济的发展,亟需大数据技术来重新组建和处理信用信息数据。本平台数据资源由原材料、半产品、产品、历史档案、业务规则、元数据和外部数据库组成。其中原材料库是平台信用信息存储于系统本地的最全的数据库,原材料库的数据来源于通过平台与外部数据交换而落袋于本地,以及由平台业务产生的信用信息。原材料库中的信用信息通过清洗、比对、去重而融合形成为一致可靠的信用数据,存储于半产品数据库中。半产品库中的信用数据经审核存放于产品库中,以服务于数据应用需求。历史档案库储存各类日志信息、快照信息以及法人库和人口库的原始数据,记录平台数据使用轨迹,以供系统追溯。业务规则库和元数据库是信用信息产品形成过程中,平台提供的业务环境。
本发明平台部署于政务外网和互联网,政务外网的连接通过部署边缘连接设备路由器及安全边缘设备防火墙来实现,互联网的连接同样通过路由器和防火墙来实现,路由器主要实现不同网段的数据路由,防火墙主要通过配置一定的安全策略实现业务系统设备的安全防护。政务外网和互联网间通过网闸实现物理隔离,增强政务外网核心系统的安全性。在互联网区部署VPN接入设备,在互联网用户和互联网区设备之间建立加密安全隧道,实现互联网用户的数据安全传输。
政务外网数据交换主机通过政务外网与法人库、人口库及其他政府部门包含信用信息的数据库进行数据交换,采集政府部门采集的企业、个人信用信息,并归入平台政务外网区核心主机系统的分布式核心数据库集群。政务外网平台核心主机系统将对从政府部门和社会主体采集的信用信息进行整理、加工,形成信用信息产品库,并定时与互联网数据库主机系统进行数据交换,并通过网闸将信用信息传递给对端的平台核心主机系统,实现两个区域数据的一致。通过政务外网,该平台还可以实现与灾难备份中心连接,实现远程灾备。
互联网数据交换主机系统通过互联网,利用VPN接入设备,采用VPN加密隧道方式与公用事业部门、社会组织及其他社会主体连接,采集各类社会主体采集的企业、个人信用信息,并归入平台互联网区核心主机系统的分布式核心数据库集群。
平台给各级政府职能部门提供了企业监管信息发布端口,实现了把分散在不同区域、不同部门、不同文档格式、不同类别、不便查询的零散监管信息,汇聚于本平台内相关联的企事业信用档案中,使之成为企事业信用档案的重要组成部分,并免费供大众查询、参考。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等同物界定。