本发明涉及网络技术领域,特别涉及风险控制方法与装置。
背景技术:
城市地铁发展日益加速,已经成为市民的日常通行方式。目前地铁主流的支付方式为单次卡支付、储值卡(地铁卡、市民卡等)支付和手机扫码支付等。针对储值卡支付和手机扫码支付,存在各种有意逃票的风险,其中以少充多(以最少的票价乘坐更长或最长的里程)的逃票方式最难预防。
现举例说明以少充多的逃票方式:
某地铁线路有a-b-…-y-z若干站点,最高票价9元,最低票价2元。甲乙两人每日上下班相向乘车。按照正常路线,甲上班时从a站点进站从y站点出站,应付9元,乙上班时从z站点进站从b站点出站,应付9元。
若甲乙两人相约在出站前交换储值卡或手机二维码图片,则可伪装成:甲从a站点进站,从b站点出站,实付2元,乙从z站点进站从y站点出站,实付2元,甲乙两人分别逃票9-2=7元;而甲乙下班再次交换储值卡或手机二维码图片,可以再分别逃票7元。
针对手机扫码支付,一种风险控制方式是:进出站时验证gps位置和/或手机基站位置信息。但这种风险控制方式存在实施困难的缺点。其原因在于:
技术实现要素:
有鉴于此,本发明实施例提供风险控制方法与装置,以对地铁支付进行易于实施的风险控制。
为实现上述目的,本发明实施例提供如下技术方案:
一种风险控制方法,基于通行时间统计数据,所述通行时间统计数据至少包括各时段内任两站点间的通行时间上限;
所述风险控制方法包括:
获取用户的通行记录;所述通行记录包括:进站数据和出站数据;其中,所述进站数据包括用户标识、第一站点和进站时间;所述出站数据包括用户标识、第二站点和出站时间;所述用户标识用于表征所述用户;所述第一站点为所述用户进站的站点,所述第二站点为所述用户出站的站点;
根据所述通行记录,计算所述用户的实际通行时间;所述实际通行时间为所述用户的出站时间与进站时间的差值;
确定所述实际通行时间所对应的时段和目标通行时间上限;所述实际通行时间所对应的时段为目标时段;所述第一站点和所述第二站点在所述目标时段所对应的通行时间上限为目标通行时间上限;
若所述用户的实际通行时间大于所述目标通行时间上限,对所述用户执行风险控制策略。
可选的,在获取用户的进站数据和出站数据之前,还包括:获取统计周期内的通行记录样本;对所述通行记录样本进行分析,得到在任一时段内任两站点间用户的实际通行时间样本;根据所述实际通行时间样本,绘制在所述任一时段内任两站点间实际通行时间的散点分布曲线;确定所述散点分布曲线的置信区间;其中,所述置信区间的面积与所述散点分布曲线的总面积的比值为预设值,所述置信区间的置信下限为所述任两站点间的地铁运行时间,所述置信区间的置信上限为在所述目标时段内所述任两站点间的通行时间上限。
可选的,所述实际通行时间散点分布曲线的横坐标表征实际通行时间样本,纵坐标表征通行人次;或者,所述实际通行时间散点分布曲线的横坐标表征实际通行时间样本,纵坐标表征出现概率。
可选的,所述各时段包括:工作日早高峰时段、工作日晚高峰时段、工作日其他时段、节假日时段中的至少两种。
可选的,所述通行记录由站点闸机收集。
可选的,所述风险控制策略至少包括:上报异常记录;所述异常记录包括所述用户的通行记录、所述用户的实际通行时间,以及,所述目标通行时间上限。
一种风险控制装置,基于通行时间统计数据,所述通行时间统计数据至少包括各时段内任两站点间的通行时间上限;
所述装置包括:
第一获取单元,用于获取用户的通行记录;其中,所述通行记录包括:进站数据和出站数据;所述进站数据包括用户标识、第一站点和进站时间;所述出站数据包括用户标识、第二站点和出站时间;所述用户标识用于表征所述用户;所述第一站点为所述用户进站的站点,所述第二站点为所述用户出站的站点;
风险控制单元,用于:
根据所述通行记录,计算所述用户的实际通行时间;所述实际通行时间为所述用户的出站时间与进站时间的差值;
确定所述实际通行时间所对应的时段和目标通行时间上限;所述实际通行时间所对应的时段为目标时段;所述第一站点和所述第二站点在所述目标时段所对应的通行时间上限为目标通行时间上限;
若所述用户的实际通行时间大于所述目标通行时间上限,对所述用户执行风险控制策略。
可选的,还包括:第二获取单元,用于获取统计周期内的通行记录样本;分析单元,用于:对所述通行记录样本进行分析,得到在任一时段内任两站点间用户的实际通行时间样本;根据所述实际通行时间样本,绘制在所述任一时段内任两站点间实际通行时间的散点分布曲线;确定所述散点分布曲线的置信区间;其中,所述置信区间的面积与所述散点分布曲线的总面积的比值为预设值,所述置信区间的置信下限为所述任两站点间的地铁运行时间,所述置信区间的置信上限为在所述目标时段内所述任两站点间的通行时间上限。
可选的,所述各时段包括:工作日早高峰时段、工作日晚高峰时段、工作日其他时段、假日时段和节日时段中的至少两种。
可选的,所述风险控制策略至少包括:上报异常记录;所述异常包括所述用户的通行记录、所述用户的实际通行时间,以及,所述目标通行时间上限。
一种风险控制装置,其特征在于,至少包括处理器和存储器;所述处理器通过执行所述存储器中存放的程序以及调用其他设备,执行上述的方法。
可见,在本发明实施例中,若用户进出站的实际通行时间大于在相应时段的通行时间上限,会对该用户执行风险控制策略。沿用前例,按照正常路线,甲上班时从a站点进站从y站点出站(共经历25站),乙上班时从z站点进站从b站点出站(共经历25站)。若甲乙两人相约在出站前交换储值卡或手机二维码图片,可伪装成甲从a站点进站从b站点出站,乙从z站点进站从y站点出站。但甲的进出站时间会远大于a站点与b站点间的通行时间上限,因此,会被执行风险控制策略,同理,乙的进出站时间也会远大于z站点与y站点间的通行时间上限,因此,同样会被执行风险控制策略。这样可在一定程度上识别出以少充多的逃票行为,对其进行风险控制。
并且,本发明实施例采集的是用户的进出站数据,并不需要使用用户敏感信息(gps位置或手机基站定位信息),也并不需要用户或运营商配合,相对易于实施。
附图说明
图1a为本发明实施例提供的风险控制装置的示例性结构;
图1b为本发明实施例提供的示例性应用场景;
图2为本发明实施例提供的分析得到通行时间统计数据的示例性流程;
图3a和图3b为本发明实施例提供的散点分布曲线示意图;
图4为本发明实施例提供的置信区间示意图;
图5为本发明实施例提供的风险控制方法的一种示例性流程;
图6为本发明实施例提供的获取用户实时的通行记录的示例性流程;
图7为本发明实施例提供的风险控制装置的硬件结构示意图。
具体实施方式
目前地铁公司采取的风控方式包括:进出站超过4小时(杭州为例,其他城市类同),以线路最高票价计算。然而,此方法只能控制地铁乞讨人员,无法控制以少充多的逃票人员(因为一般1个小时内都会出站,不会超过限制时间),并且,针对以少充多的逃票方式基本没有用。
针对手机扫码支付,目前对以少充多的逃票方式的风险控制包括:进出站时验证gps位置和/或手机基站位置信息。但这种风险控制方式存在实施困难的缺点,并且,针对储值卡支付没有用。
有鉴于此,本发明实施例提供风险控制方法与装置,以解决上述问题。
请参见图1a,上述风险控制装置包括:第一获取单元1和风险控制单元2。
在本发明其他实施例中,仍请参见图1,上述风险控制装置还可包括:第二获取单元3和分析单元4。
后续将结合风险控制方法对上述各单元的作用进行进一步的介绍。
上述风险控制装置中的各模块可以软件或组件的形式部署于同一服务器(例如数据分析服务器或联动风控服务器)上,或者,上述风险控制装置所包含的各模块可分别为独立的服务器。
风险控制装置基于通行时间统计数据进行风险控制。具体的,通行时间统计数据至少包括各时段内任两站点间的通行时间上限。
在一个示例中,上述各时段可包括:工作日早高峰时段、工作日晚高峰时段、工作日其他时段、节假日时段的至少两种。
上述各时段可支持自定义配置。本领域技术人员可根据不同地区的特点对其进行灵活配置。例如,可配置早高峰时段为7:00-9:00,晚高峰时段为16:30-18:30。
同理,节假日时段也可进行灵活配置,例如,可设置周六、周日为节假日时段,5月1日至5月3日为节假日时段,以及10月1日至10月7日为节假日时段等。
以早高峰时段为例,假定共有a、b、c三个站点,则在一个示例中,在早高峰时段,任两站点间的通行时间上限可包括:a、b站点间的通行时间上限,b、c站点间的通行时间上限,以及,a、c站点间的通行时间上限。
在另一示例中,不同的方向亦可对应一通行时间上限。仍以早高峰时段、共有a、b、c三个站点为例,任两站点间的通行时间上限可包括:
a至b方向(即从站点a进站,从站点b出站)的通行时间上限;
b至a方向(即从站点b进站,从站点a出站)的通行时间上限;
b至c方向(即从站点b进站,从站点c出站)的通行时间上限;
c至b方向(即从站点c进站,从站点b出站)的通行时间上限;
a至c方向(即从站点a进站,从站点c出站)的通行时间上限;
c至a方向(即从站点c进站,从站点a出站)的通行时间上限。
图1b示出了上述风险控制装置的一种示例性应用场景:各闸机可采集用户的通行记录,风险控制装置(图1b中的风险控制服务器)可使用在统计周期内(例如3个月或半年)内的历史通行记录作为样本,分析得到上述通行时间统计数据。风险控制装置还会使用闸机采集的实时的通行记录,对用户进行风险评估,对有风险的用户执行风险控制策略。其中,风险控制策略可至少包括:向地铁系统上报异常记录。
需要说明的是,由于要计费和计时,闸机本来就已经在收集通行记录。
下面将基于上述共性介绍,对本发明实施例做进一步详细说明。
先介绍如何分析得到通行时间统计数据。请参见图2,其示例性地可包括如下步骤:
s201:获取统计周期内的通行记录样本。
通行记录样本是在统计周期内由闸机采集的用户的通行记录。本领域技术人员可灵活设计统计周期的长度,例如3个月、半年等。
具体的,通行记录可包括:进站数据和出站数据。
其中,进站数据包括用户标识(用户标识用于表征用户)、第一站点(用户进站的站点)和进站时间;出站数据包括用户标识、第二站点(用户出站的站点)和出站时间。
步骤s201可由前述的第二获取单元3执行。第二获取单元3可存储闸机采集的通行记录,累积一段时间(统计周期)后,得到海量的历史通行记录作为通行记录样本。
s202:对通行记录样本进行分析,得到在任一时段内任两站点间不同用户的实际通行时间样本。
实际通行时间样本即历史实际通行时间。举例来讲,假定统计周期为2019年1月1日至7月1日,在此期间,某用户在早高峰时段的7:00在a站点进站,经a、b、c、d这4站,再坐2号线经m、n、o、p站点,至q站点出站,出站时间为7:30,则用户的实际通行时间样本是a站与q站之间的实际通行时间—30分钟。
当然,a站与q站间实际通行时间的下限是地铁运行时间,这是因为加上步行进出站所耗费的时间和候车时间,用户的实际通行时间必然大于地铁运行时间,所以实际通行时间的下限是地铁运行时间。此外,若有多种换乘路径,可取最小地铁运行时间为下限。
对海量的通行记录样本进行分析,可得到不同时段(工作日早高峰时段、工作日晚高峰时段、工作日其他时段、节假日时段),任意两个站点之间的实际通行时间作为实际通行时间样本。
步骤s202可由前述的分析单元4执行。
s203:根据实际通行时间样本,绘制在任一时段内任两站点间实际通行时间的散点分布曲线。
步骤s203可由前述的分析单元4执行。
在一个示例中,请参见图3a,实际通行时间散点分布曲线的横坐标可表征实际通行时间样本,纵坐标可表征通行人次;
或者,
在另一个示例中,请参见图3b,实际通行时间散点分布曲线的横坐标可表征实际通行时间样本,纵坐标可表征出现概率。
无论何种散点分布曲线,其一般符合泊松分布。
s204:确定散点分布曲线的置信区间,得到的置信区间的置信上限为通行时间上限。
步骤s204可由前述的分析单元4执行。
置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(confidenceinterval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,其给出的是被测量参数的测量值的可信程度。
以图4所示的早高峰时段a-b两站点间实际通行时间样本-出现概率曲线为例,置信区间的置信下限为早高峰时段a-b两站点间的地铁运行时间(出现概率为0)置信区间的置信上限即早高峰时段a-b两站点间的通行时间上限。
过置信上限作一条虚线(控制线),控制线左侧的面积(即置信区间的面积)与分布曲线总面积比值为预设值。
本领域技术人员可根据需要灵活设置预设值的大小,例如,可设置其为99.9%、99.99%、99.999%等。
在一个示例中,可对应不同的预设值(例如99.9%、99.99%、99.999%)计算多个置信上限,从中选择出一个作为通行时间上限。例如,选择了99.99%的置信区间,平均通行时间为5.2435分钟,通行时间上限为13.4713分钟。
根据不同时段实际通行时间样本,结合预设值,可计算不同时段场景下的通行时间上限。基于大数据分析可给出科学合理的选择,并可灵活调整通行时间上限。
在得到各时段任两站点间的通行时间上限后,可使用风险控制装置进行风险。
图5示出了由上述风险控制装置所执行的风险控制方法的一种示例性流程,包括:
s501:获取用户实时的通行记录。
与历史通行记录相同,实时的通行记录同样包括进站数据和出站数据;其中,进站数据包括用户标识、第一站点和进站时间;出站数据包括用户标识、第二站点和出站时间,在此不作赘述。
步骤s501可由前述的第一获取单元1执行。
进站数据和出站数据同样由闸机提供。
请参见图6,某用户从闸机1进站扫码或刷卡,闸机1会记录其进站数据,提供给风险控制装置;之后,该用户从闸机2出站扫码或刷卡,闸机2会记录其出站数据,提供给风险控制装置,风险控制装置在获取到出站数据后,会根据用户id查找其进站数据。
s502:根据用户实时的通行记录,计算用户当前的实际通行时间。
实际通行时间为用户的出站时间与进站时间的差值。举例来讲,假定出站数据中的出站时间为8:00,进站数据中的进站时间为7:40,则用户当前的实际通行时间为20分钟。
步骤s502可由前述的风险控制单元2执行。
s503:确定实际通行时间所对应的时段及目标通行时间上限。
步骤s503可由前述的风险控制单元2执行。
具体的,可根据出站数据和进站数据确定所对应的时段。
在一个示例中,只要进站时间或出站时间落在一时段的区间内,就确定对应该时段。
举例来讲,早高峰时段为7:00-9:00,某用户进站时间为8:00,出站时间为9:10,由于进站时间位于早高峰时段,可确定其对应早高峰时段,另一用户进站时间为6:50,出站时间为7:20,出站时间位于早高峰时段,也确定其对应早高峰时段。
此外,考虑一种特殊情况,用户的进站时间早于7:00,出站时间晚于9:00,对于这种特殊情况,也可确定其对应早高峰时段。
可将确定出的时段称为目标时段。在确定出目标时段后,可进一步确定第一站点和第二站点在目标时段所对应的通行时间上限(可为目标通行时间上限)。
举例来讲,假定目标时段为早高峰时段,第一站点为站点a,第二站点为站点b,站点a和b在早高峰时段对应的通行时间上限为13.4713分钟,平均通行时间为5.2435分钟,则可确定出目标通行时间上限为13.4713分钟。
s504:若用户的实际通行时间大于目标通行时间上限,对该用户执行风险控制策略。
举例来讲,某用户进站时间为6:50,出站时间为7:20,其实际通行时间为20分钟,大于13.4713分钟,则对该用户执行风险控制策略。
在一个示例中,风险控制策略至少包括上报异常记录。其中,异常记录可包括该用户的通行记录、用户的实际通行时间、目标通行时间上限,此外还可包括平均通行时间。
在本发明其他实施例中,还可在异常记录中标识该用户在预设时段(例如一月)内产生异常记录的次数。
步骤s504可由前述的风险控制单元2执行。
在一个示例中,风险控制单元2可将异常记录上报至地铁公司管理系统。
地铁公司管理系统的风险库里可创建相应的风控规则,风控规则内容示例性地包括:在用户每月出现第3次上述异常记录时,锁定该用户的储值卡或手机扫码账号,要求用户申述原因,管理方审核通过后才能解锁。
可见,在本发明实施例中,若用户进出站的实际通行时间大于在相应时段的通行时间上限,会对该用户执行风险控制策略。沿用前例,按照正常路线,甲上班时从a站点进站从y站点出站(共经历25站),乙上班时从z站点进站从b站点出站(共经历25站)。若甲乙两人相约在出站前交换储值卡或手机二维码图片,可伪装成甲从a站点进站从b站点出站,乙从z站点进站从y站点出站。但甲的进出站时间会远大于a站点与b站点间的通行时间上限,因此,会被执行风险控制策略,同理,乙的进出站时间也会远大于z站点与y站点间的通行时间上限,因此,同样会被执行风险控制策略。这样可在一定程度上识别出以少充多的逃票行为,对其进行风险控制。
并且,本发明实施例采集的是用户的进出站数据,并不需要使用用户敏感信息(gps位置或手机基站定位信息),也并不需要用户或运营商配合,相对易于实施。
此外,本发明实施例还具有如下优点:
·无需改造硬件设备;
·基于大数据分析可给出科学合理的选择,并可灵活调整通行时间上限;
·只给出技术建议,决策权仍然由地铁运营公司把握;
·采用通行记录进行风险控制,无论用户采用何种支付方式,进出站时都会有相应的记录,因此,并不受限于支付方式。
下面介绍上述风险控制装置的示例性结构,请参见图1a,其可包括:
第一获取单元1,用于获取用户的通行记录;
其中,通行记录包括:进站数据和出站数据;进站数据包括用户标识、第一站点和进站时间;出站数据包括用户标识、第二站点和出站时间;用户标识用于表征用户;第一站点为用户进站的站点,第二站点为用户出站的站点;
风险控制单元2,用于:
根据通行记录,计算用户的实际通行时间;实际通行时间为用户的出站时间与进站时间的差值;
确定实际通行时间所对应的时段和目标通行时间上限;实际通行时间所对应的时段为目标时段;第一站点和第二站点在目标时段所对应的通行时间上限为目标通行时间上限;
若用户的实际通行时间大于目标通行时间上限,对用户执行风险控制策略。
通行记录可由站点闸机收集。
具体细节请参见本文前述记载,在此不作赘述。
在本发明其他实施例中,仍请参见图1a,上述风险控制装置还可包括:
第二获取单元3,用于获取统计周期内的通行记录样本;
分析单元4,对通行记录样本进行分析,得到在任一时段内任两站点间用户的实际通行时间样本;
根据实际通行时间样本,绘制在任一时段内任两站点间实际通行时间的散点分布曲线;
确定散点分布曲线的置信区间;
其中,置信区间的面积与散点分布曲线的总面积的比值为预设值,置信区间的置信下限为任两站点间的地铁运行时间,置信区间的置信上限为在目标时段内任两站点间的通行时间上限。
其中,上述各时段包括:工作日早高峰时段、工作日晚高峰时段、工作日其他时段、假日时段和节日时段中的至少两种。
上述风险控制策略至少包括:上报异常记录;异常记录包括用户的通行记录、用户的实际通行时间,以及,目标通行时间上限。
具体细节请参见本文前述记载,在此不作赘述。
图7示出了上述实施例中风险控制装置的一种可能的硬件结构示意图,包括:总线、处理器701、存储器702、通信接口703、输入设备704和输出设备705。处理器701、存储器702、通信接口703、输入设备704和输出设备705通过总线相互连接。其中:
总线可包括一通路,在计算机系统各个部件之间传送信息。
处理器701可以是通用处理器,例如通用中央处理器(cpu)、网络处理器(networkprocessor,简称np)、微处理器等,也可以是特定应用集成电路(application-specificintegratedcircuit,asic),或一个或多个用于控制本发明方案程序执行的集成电路。还可以是数字信号处理器(dsp)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
存储器702中保存有执行本发明技术方案的程序或脚本,还可以保存有操作系统和其他关键业务。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。脚本则通常以文本(如ascii)保存,只在被调用时进行解释或编译。
输入设备704可包括接收用户输入的数据和信息的装置,例如键盘、鼠标、摄像头、语音输入装置、触摸屏等。
输出设备705可包括允许输出信息给用户的装置,例如显示屏、扬声器等。
通信接口703可包括使用任何收发器一类的装置,以便与其他设备或通信网络通信,如以太网,无线接入网(ran),无线局域网(wlan)等。
处理器701通过执行存储器702中所存放的程序以及调用其他设备,可实现上述实施例提供的风险控制方法。
此外,图7所示的风险控制装置各单元的功能,可由前述的处理器701执行存储器702中所存放的程序以及调用其他设备实现。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及模型步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或模型的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、wd-rom、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。