基于出入境记录的水客智能挖掘分析方法与流程

文档序号:23704210发布日期:2021-01-23 12:25阅读:233来源:国知局
基于出入境记录的水客智能挖掘分析方法与流程

[0001]
本发明涉及公共安全管理技术领域,更具体涉及一种基于出入境记录的水客智能挖掘分析方法,应用于陆路海关旅检现场监管。


背景技术:

[0002]
海关是我国进出境活动管理体系中最重要的组成机构之一,主要负责对进出境人员、物品、货物和贸易流的口岸监管。在陆路旅检口岸(如澳门与珠海),据不完全统计,常年活跃于珠澳两地的职业水客人数过万,此行为扰乱了市场秩序、造成了关税流失。由于水客行为者与普通游客、雇员、本地居民等混在一起通关,旅检过程无法有效识别。
[0003]
为了破解此难题,目前的做法是通关核验发现对应证件一天内多次通关时,进行预警,并安排对其行李等进行检查,以及依靠边检人员多年练就的经验,进行抽查。
[0004]
虽然通过这些方式,能够抓获部分水客,但存在较大的弊端:一是抽查带有主观性,容易误判;二是并未考虑同一个人使用多个证件进行通关的情况,比如一天内,分别使用护照、港澳通行证等不同证件进行多次通关的情况,无法及时有效地识别一人当天多次通关的情况,容易出现漏判。


技术实现要素:

[0005]
本发明需要解决的技术问题是提供一种基于出入境记录的水客智能挖掘分析方法,以解决目前出入境通关核验的方法容易误判,以及无法及时有效地识别一人当天多次通关的情况而容易出现漏判的问题,以能够及时有效地识别一人当天多次通关的情况,防止漏盘情况的发生,并能够基于海量旅客通关记录,智能推导潜在的职业水客行为对象。
[0006]
为解决上述技术问题,本发明所采取的技术方案如下。
[0007]
基于出入境记录的水客智能挖掘分析方法,包括以下步骤:
[0008]
s1、对已有的海量出入境数据进行清洗,将一人多证的情况进行标记;
[0009]
s2、通过目前已经抓获的水客出入境记录,分析得出水客的行为规律;
[0010]
s3、根据步骤s2中水客的行为规律,对步骤s1中已进行标记的历史数据进行清洗分析,挖掘符合水客行为规律的记录;
[0011]
s4、定期自动推送潜在水客行为对象。
[0012]
进一步优化技术方案,所述步骤s1包括以下步骤:
[0013]
s11、提取所有出入境记录中的证件号码信息、维度记录信息、过境照片信息,并计算是否存在:证件号码信息不同、维度记录信息相同的情况;
[0014]
s12、若存在证件号码信息不同、维度记录信息相同的情况,在此基础上加以比对过境照片信息;
[0015]
s13、在步骤s12中,若过境照片信息相同,则判定对应的证件号码属于同一个对象,并进行标记。
[0016]
进一步优化技术方案,所述维度记录信息包括姓名、出生日期、性别、原居地。
[0017]
进一步优化技术方案,所述维度记录信息包括姓名、出生日期、性别、发证地。
[0018]
进一步优化技术方案,所述步骤s2包括以下步骤:
[0019]
s21、通过分析已被抓获的水客对象,反查其历史出入境记录;
[0020]
s22、采用apriori算法挖掘水客出入境记录中各要素间的频繁项集和关联规则;
[0021]
s23、生成出入境记录中涉及各要素的项集列表;
[0022]
s24、扫描计算各项集的最小支持度要求,去除不符合最小支持度的集合;
[0023]
s25、对剩下的项集进行组合;
[0024]
s26、重新扫描出入境记录,去除不符合最小支持度的项集;
[0025]
s27、重复进行步骤s25和步骤s26,直到所有项集都被去除;
[0026]
s28、得到各关键要素以及各关键要素的关联关系,确定水客行为规律。
[0027]
进一步优化技术方案,所述步骤s21中,分别计算水客每次出入境的时间间隔、每天往返的次数、每天多次往返的天数在每月中的占比。
[0028]
进一步优化技术方案,所述步骤s22中,各要素包括:性别、国籍、出入境类别、出入边境站、出入境时间、每次出入的交通方式、每次出入境时间间隔在每月中的占比、每天往返的次数在每月中的占比、每天多次往返的天数在每月中的占比。
[0029]
进一步优化技术方案,所述步骤s3和步骤s4中,根据水客行为规律,后台自动全量比对分析每月的出入境记录,自动推送潜在水客行为对象信息,协助旅检人员打击水客。
[0030]
由于采用了以上技术方案,本发明所取得技术进步如下。
[0031]
本发明利用大数据技术和数据挖掘/机器学习算法,得出水客智能挖掘分析模型,实现了自动推送潜在水客行为对象的目的,提升了研判效率,能够有效协助旅检部门进行水客行为打击行动。
[0032]
本发明通过数据清洗,通过对历史出入境记录进行通关规律挖掘分析,能够自动推出符合规律的潜在水客,解决了一人多证件之间的关联关系,尽量减少了出入境记录水客行为分析时出现遗漏的问题。
附图说明
[0033]
图1为本发明的架构流程图。
具体实施方式
[0034]
下面将结合附图和具体实施例对本发明进行进一步详细说明。
[0035]
一种基于出入境记录的水客智能挖掘分析方法,结合图1所示,包括以下步骤:
[0036]
s1、数据清洗(一人多证):对已有的海量出入境数据进行清洗,将一人多证的情况进行标记,增加推导的准确性。
[0037]
步骤s1包括以下步骤:
[0038]
s11、提取所有出入境记录中的证件号码信息、维度记录信息、过境照片信息,并计算是否存在:证件号码信息不同、维度记录信息相同的情况。维度记录信息包括姓名、出生日期、性别、原居地等。或者维度记录信息包括姓名、出生日期、性别、发证地等。
[0039]
s12、若存在证件号码信息不同、维度记录信息相同的情况,分为以下两种情况:
[0040]
a.证件号码不同,姓名、出生日期、性别、原居地等维度记录均相同;
[0041]
b.证件号码不同,姓名、出生日期、性别、发证地等维度记录均相同。
[0042]
在此基础上加以比对过境照片信息。
[0043]
s13、在步骤s12中,若过境照片信息相同,则判定对应的证件号码属于同一个对象,并进行标记。在进行数据挖掘时,此类不同证件号码产生的记录,均应当成同一对象进行分析。
[0044]
s2、生成水客行为规律:通过目前已经抓获的水客出入境记录,计算获得新要素,分析得出水客每天/每个月的行为规律。
[0045]
步骤s2包括以下步骤:
[0046]
s21、通过分析已被抓获的水客对象,反查其历史出入境记录。步骤s21中,分别计算水客每次出入境的时间间隔、每天往返的次数、每天多次往返的天数在每月中的占比。
[0047]
s22、采用apriori算法挖掘水客出入境记录中各要素间的频繁项集和关联规则。
[0048]
步骤s22中,各要素包括:性别、国籍、出入境类别、出入边境站(关口)、出入境时间、每次出入的交通方式、每次出入境时间间隔在每月中的占比、每天往返的次数在每月中的占比、每天多次往返的天数在每月中的占比。
[0049]
s23、生成出入境记录中涉及各要素的项集列表。
[0050]
以珠海关闸边境站抓获水客2019出入境记录为例,各项集如下:
[0051][0052]
s24、扫描计算各项集的最小支持度要求,去除不符合最小支持度的集合。通过分析各项集支持度,计算结果如下:
[0053]
项集支持度国籍(chi)0.5国籍(hk)0.3国籍(tai)0.2交通方式(步行)0.7交通方式(汽车)0.3同一天一出一入时间间距0-20min)0.2同一天一出一入时间间距(20-40min)0.6同一天一出一入时间间距(40-60min)0.2同一天满足出入时间间距的记录(>=3)1.0每月符合条件天数(>=9)0.7每月符合条件天数(<9)0.3
[0054]
设定最小支持度为0.3,只有大于0.3的项属于频繁项集,最终结果如下:
[0055]
项集支持度国籍(chi)0.5国籍(hk)0.3交通方式(步行)0.7交通方式(汽车)0.3同一天一出一入时间间距(20-40min)0.6同一天满足出入时间间距的记录(>=3)1.0每月符合条件天数(>=9)0.7每月符合条件天数(<9)0.3
[0056]
s25、对剩下的项集进行组合,以生成包含两个以上要素的项集。
[0057]
两两组合后,得到如下项集:
[0058]
[0059][0060]
s26、重新扫描出入境记录,去除不符合最小支持度的项集。
[0061]
通过分析各项集支持度,计算结果如下:
[0062]
[0063][0064]
设定最小支持度为0.5,只有大于0.5的项属于频繁项集,最终结果如下:
[0065][0066]
s27、重复进行步骤s25和步骤s26,直到所有项集都被去除。
[0067]
s28、得到各关键要素以及各关键要素的关联关系,确定水客行为规律。
[0068]
各关键要素为出入边境站(关口)、出入境时间、每次出入的交通方式、每次出入境时间间隔、每天往返的次数、每个月占比,每个月占比为每次出入境时间间隔在每月中的占比、每天往返的次数在每月中的占比、每天多次往返的天数在每月中的占比。
[0069]
最终得到如下关系:a.交通方式(步行);b.同一天一出一入时间间距(20-40min);c.同一天满足出入时间间距的记录(>=3);d.每月符合条件天数(>=9)。
[0070]
根据以上规律进行所有数据扫描,只要过境记录同时符合以上4个规律的对象,将被作为可疑水客对象推送给前端,协助旅检人员打击水客。
[0071]
s3、根据步骤s2中水客的行为规律,对步骤s1中已进行标记的历史数据进行清洗分析,挖掘符合水客行为规律的记录,尤其是近一个月的出入境记录符合水客规律的人员,
综合运算,进行智能挖掘推导。
[0072]
s4、定期自动推送潜在水客行为对象。
[0073]
通过算法挖掘分析得到的所有疑似水客信息,会更新记录至指定的数据表,业务分析系统定期从此数据表获取最新的记录,并对相关对象进行再次核验/比对,以最终确认其身份背景。
[0074]
步骤s3和步骤s4中,根据水客行为规律,后台自动全量比对分析每月的出入境记录,自动推送潜在水客行为对象信息,协助旅检人员打击水客。
[0075]
本发明通过数据清洗,解决了一人多证件之间的关联关系,尽量减少了出入境记录水客行为分析时出现遗漏的问题。
[0076]
本发明利用大数据技术和数据挖掘/机器学习算法,得出水客智能挖掘分析模型,实现了自动推送潜在水客行为对象的目的,提升了研判效率,能够有效协助旅检部门进行水客行为打击行动。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1