1.本发明涉及信息处理技术领域,尤其涉及一种实人认证的数据稽核方法、装置、计算机设备及存储介质。
背景技术:2.实人认证业务是为了加强电话用户真实身份信息登记管理,要求电信业务经营者在为电话用户办理入网手续时,如实登记用户真实身份信息。在实人登记过程中有人证一致性查验、证件真实性查验、现场拍照留存等步骤。
3.通过在线视频实人认证业务中,要求用户通过手机端现场实时拍摄视频文件进行完成现场拍照留存和人证一致性检测的要求,但是目前发现在线视频实人认证业务中部分用户利用一些技术手段将照片合成动态视频,伪造成用户本人现场拍照,该行为存在绕过本人现场拍照的风险,会导致个人用户信息会被非法分子盗用进行实人认证业务。
技术实现要素:4.本发明实施例提供了一种实人认证的数据稽核方法、装置、计算机设备及存储介质,提高了在实人认证过程中的稽核准确率。
5.第一方面,本发明实施例提供了一种实人认证的数据稽核方法,该方法包括:
6.若检测到实人认证系统所上传的待检测视频,将所述待检测视频输入预设稽核模型;
7.通过所述预设稽核模型提取所述待检测视频中的关键帧画面,并识别所述关键帧画面中带有身份证信息和水印的画面,并且将其作为目标图像特征;
8.通过所述预设稽核模型计算所述目标图像特征的置信度,并判断所述置信度是否大于第一预设阈值;
9.若所述置信度大于所述第一预设阈值,则将所述待检测视频确认为不合规视频。
10.第二方面,本发明实施例还提供了一种实人认证的数据稽核装置,该装置包括:
11.第一检测单元,用于若检测到实人认证系统所上传的待检测视频,将所述待检测视频输入预设稽核模型;
12.第一识别单元,用于通过所述预设稽核模型提取所述待检测视频中的关键帧画面,并识别所述关键帧画面中带有身份证信息和水印的画面,并且将其作为目标图像特征;
13.第一判断单元,用于通过所述预设稽核模型计算所述目标图像特征的置信度,并判断所述置信度是否大于第一预设阈值;
14.第一确认单元,用于若所述置信度大于所述第一预设阈值,则将所述待检测视频确认为不合规视频。
15.第三方面,本发明实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。
16.第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储
有计算机程序,所述计算机程序当被处理器执行时可实现上述方法。
17.本发明实施例提供了一种实人认证的数据稽核方法、装置、计算机设备及存储介质。其中,所述方法包括:若检测到实人认证系统所上传的待检测视频,将所述待检测视频输入预设稽核模型;通过所述预设稽核模型提取所述待检测视频中的关键帧画面,并识别所述关键帧画面中带有身份证信息和水印的画面,并且将其作为目标图像特征;通过所述预设稽核模型计算所述目标图像特征的置信度,并判断所述置信度是否大于第一预设阈值;若所述置信度大于所述第一预设阈值,则将所述待检测视频确认为不合规视频。本发明实施例通过在对待检测视频进行检测时,可以通过预设稽核模型识别待检测视频中的带有身份证信息和水印的画面,并将其作为目标图像特征进行置信度的计算,根据置信度和第一预设阈值的大小来判断身份证信息中是否有不合规的信息或者是否带有水印,当置信度大于第一预设阈值时,判断该待检测视频为不合规视频,提高了在实人认证中自动稽核的准确性。
附图说明
18.为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
19.图1是本发明实施例提供的实人认证的数据稽核方法的流程示意图;
20.图2是本发明实施例提供的实人认证的数据稽核装置的示意性框图;
21.图3是本发明实施例提供的计算机设备的示意性框图。
具体实施方式
22.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
23.应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、操作、元素、组件和/或其集合的存在或添加。
24.还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
25.请参阅图1,图1是本发明实施例提供的实人认证的数据稽核方法的流程示意图。本发明实施例的实人认证的数据稽核方法应用于任一计算机设备。如图1所示,该方法包括步骤s110~s140。
26.s110,若检测到实人认证系统所上传的待检测视频,将所述待检测视频输入预设稽核模型。
27.在本发明实施例中,实人认证是指需要用户授权,或者对用户本人信息进行验证时,需要用户手持身份证进行视频的录制,并将录制的视频上传,通过后台程序或者人工进行审核,所上传的视频即为待检测视频。当检测到待检测视频后,将待检测视频输入预设稽核模型,通过预设稽核模型对待检测视频进行合规性的判断,主要内容包括但不限于是否是本人拍摄的视频,视频内容是否清晰以及是否是合成视频。
28.在某些实施例,例如本实施例中,所述实人认证的数据稽核方法还包括:获取预设训练集,其中,所述预设训练集包括多个带有标注的图片;通过神经网络模型和所述预设训练集中带有标注的图片对所述预设训练集进行训练以获得所述预设稽核模型。
29.其中,所述获取预设训练集的步骤之前,还包括如下步骤:获取预设训练视频,并提取所述预设训练视频中的所有光流视频帧;将所有所述光流视频帧中光流移动次数最少的光流视频帧作为关键帧;对所述关键帧中带有所述身份证信息和所述水印的区域进行标注以获得所述带有标注的图片,并将所有所述带有标注的图片作为所述预设训练集。
30.在本发明实施例中,用户在进行录制时,一般是手持身份证,保持一段时间不动,也即一般情况下,除了人体必要的生理动作,例如眨眼睛,用户所录制的视频是静态的,尤其对于身份证信息,除了晃动以外,其位置不会有明显变化,同时,如果是实时录制的视频,除了环境背景,不会有其他的水印。因此,可以将以往用户所上传的视频作为预设训练视频,并提取预设训练视频中光流的视频帧,其中,光流可以理解为,视频中动作变化的画面,将所有光流视频帧中,光流移动次数最少的光流视频帧作为关键帧,再对关键帧中带有身份证信息和水印的区域进行标注,为了提高准确性,可以由用户进行人工标注,从而获得预设训练集。再通过神经网络模型对预设训练集中的带有身份证信息和水印的区域进行训练以获得初始训练模型。
31.在某些实施例,例如本实施例中,所述通过神经网络模型和所述预设训练集中带有标注的图片对所述预设训练集进行训练以获得所述预设稽核模型的步骤,还包括如下步骤:获取预设待识别样本集,通过yolov5神经网络模型和所述预设待识别样本集对所述初始训练模型进行训练以获得正样本集和负样本集;通过所述正样本集和所述负样本集对所述初始训练模型进行训练以获得所述预设稽核模型;所述通过所述正样本集和所述负样本集对所述初始训练模型进行训练以获得所述预设稽核模型的步骤还包括如下步骤:通过所述负样本集对所述初始训练模型进行训练以获得中间训练模型;在所述正样本集中的图片上随机生成所述水印以获得目标正样本集;通过所述目标正样本集对所述中间训练模型进行训练以获得所述预设稽核模型。
32.在本发明实施例中,在获得初始训练模型后,需要提高初始训练模型的精度,可以将预设待识别样本集放入初始训练模型,以便于通过yolov5神经网络模型对初始训练模型进行训练以获得相应的训练结果,训练结果可以分为两类,一类是初始训练模型准确判断出待识别样本中的不合规视频,将该类视频作为正样本集,另一类是初始训练模型未能准确识别待识别样本中的不合规视频,将该类视频作为负样本集。将负样本集再次放入初始训练模型进行训练,直到初始训练模型能够准确识别出所有的不合规视频,则将初始训练模型设为中间训练模型。对于正样本集,可以通过生成一些不合规的水印或者在身份证信息上标识一些标记,再由中间训练模型进行识别以获得预设稽核模型,若通过正样本集对中间训练模型训练之后同样可以获得负样本集,则参考前文所述的方法继续训练,直到不
获得负样本集。
33.s120,通过所述预设稽核模型提取所述待检测视频中的关键帧画面,并识别所述关键帧画面中带有身份证信息和水印的画面,并且将其作为目标图像特征。
34.在某些实施例,例如本实施例中,所述步骤s120可以包括如下步骤:通过所述预设稽核模型并按照预设提取规则提取所述待检测视频中的关键帧画面;识别所述关键帧画面中带有所述身份证信息和所述水印的区域并将其作为所述目标图像特征。
35.在本发明实施例中,通过照片所合成的视频,一般情况下,其身份证的位置没有办法做到准确重合,也即不同的照片,其身份证的位置不一样,同样,身份证所在的区域所携带的信息也会存在差异,故可以提取身份证信息所在区域作为目标图像特征。另外,一般是通过照片合成视频,而大多数情况下,需要借助软件进行合成,在采用软件进行合成时,会携带有该软件的水印,水印的位置可以位于身份证所在的区域,也可以是视频中任一区域,故可以识别关键帧画面中明显与背景不符合的区域作为目标图像特征。需要注意的是,在提取待检测视频的关键帧画面时,可以是随机选取某几个帧作为关键帧画面,也可以是根据用户预设的规则,提取视频中的某几帧画面。
36.s130,通过所述预设稽核模型计算所述目标图像特征的置信度,并判断所述置信度是否大于第一预设阈值。
37.在本发明实施例中,预设稽核模型可以计算出目标图像特征的置信度,通过判断置信度与第一预设阈值的大小来判断待检测视频是否合规。其中,计算置信度的方法为本领域技术人员所公知的,在这里不展开描述。
38.在某些实施例,例如本实施例中,所述步骤s130之后可以包括如下步骤:若所述置信度小于所述第二预设阈值,则将所述待检测视频确认为合规视频;若所述置信度大于所述第二预设阈值且小于所属第一预设阈值,则上报用户进行人工稽核。
39.在本发明实施例中,第一预设阈值可以是0.95,第二预设阈值可以是0.1,当置信度小于0.1时,可以直接通过审核,当置信度处于0.95到0.1之间时,上报用户进行人工审核。
40.s140,若所述置信度大于所述第一预设阈值,则将所述待检测视频确认为不合规视频。
41.在本发明实施例中,当置信度大于第一预设阈值时,例如,大于0.95,则判定为不合规视频,不通过审核。
42.图2是本发明实施例提供的一种实人认证的数据稽核装置100的示意性框图。如图2所示,对应于以上实人认证的数据稽核方法,本发明还提供一种实人认证的数据稽核装置100。该实人认证的数据稽核装置100包括用于执行上述实人认证的数据稽核方法的单元。具体地,请参阅图2,该实人认证的数据稽核装置100包括第一检测单元110、第一识别单元120、第一判断单元130和第一确认单元140。
43.其中,第一检测单元110用于若检测到实人认证系统所上传的待检测视频,将所述待检测视频输入预设稽核模型;第一识别单元120用于通过所述预设稽核模型提取所述待检测视频中的关键帧画面,并识别所述关键帧画面中带有身份证信息和水印的画面,并且将其作为目标图像特征;第一判断单元130通过所述预设稽核模型计算所述目标图像特征的置信度,并判断所述置信度是否大于第一预设阈值;第一确认单元140用于若所述置信度
大于所述第一预设阈值,则将所述待检测视频确认为不合规视频。
44.在某些实施例,例如本实施例中,所述实人认证的数据稽核装置还包括第一获取单元和第一训练单元。
45.其中,第一获取单元用于获取预设训练集,其中,所述预设训练集包括多个带有标注的图片;第一训练单元用于通过神经网络模型和所述预设训练集中带有标注的图片对所述预设训练集进行训练以获得所述预设稽核模型。
46.在某些实施例,例如本实施例中,所述实人认证的数据稽核装置还包括第二获取单元、第二确认单元和第一标注单元。
47.其中,第二获取单元用于获取预设训练视频,并提取所述预设训练视频中的所有光流视频帧;第二确认单元用于将所有所述光流视频帧中光流移动次数最少的光流视频帧作为关键帧;第一标注单元用于对所述关键帧中带有所述身份证信息和所述水印的区域进行标注以获得所述带有标注的图片,并将所有所述带有标注的图片作为所述预设训练集。
48.在某些实施例,例如本实施例中,所述第一标注单元还包括第二识别单元和第二训练单元。
49.其中,第二识别单元用于获取预设待识别样本集,通过yolov5神经网络模型和所述预设待识别样本集对所述初始训练模型进行训练以获得正样本集和负样本集;第二训练单元用于通过所述正样本集和所述负样本集对所述初始训练模型进行训练以获得所述预设稽核模型。
50.在某些实施例,例如本实施例中,所述第二训练单元还包括第三训练单元、第三获取单元和第四训练单元。
51.其中,第三训练单元用于通过所述负样本集对所述初始训练模型进行训练以获得中间训练模型;第三获取单元用于在所述正样本集中的图片上随机生成所述水印以获得目标正样本集;第四训练单元用于通过所述目标正样本集对所述中间训练模型进行训练以获得所述预设稽核模型。
52.在某些实施例,例如本实施例中,第一识别单元120包括第一提取单元和第三识别单元。
53.其中,第一提取单元用于通过所述预设稽核模型并按照预设提取规则提取所述待检测视频中的关键帧画面;第三识别单元用于识别所述关键帧画面中带有所述身份证信息和所述水印的区域并将其作为所述目标图像特征。
54.在某些实施例,例如本实施例中,所述实人认证的数据稽核装置还包括第二判断单元和第三确认单元。
55.其中,第二判断单元用于若所述置信度小于所述第二预设阈值,则将所述待检测视频确认为合规视频;第三确认单元用于若所述置信度大于所述第二预设阈值且小于所属第一预设阈值,则上报用户进行人工稽核。
56.需要说明的是,所属领域的技术人员可以清楚地了解到,上述实人认证的数据稽核装置和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
57.上述实人认证的数据稽核装置可以实现为一种计算机程序的形式,该计算机程序可以在如图3所示的计算机设备上运行。
58.请参阅图3,图3是本技术实施例提供的一种计算机设备的示意性框图。参阅图3,该计算机设备500包括通过系统总线501连接的处理器502、存储器和接口507,其中,存储器可以包括非易失性存储介质503和内存储器504。
59.该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行一种实人认证的数据稽核方法。
60.该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
61.该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行上述实人认证的数据稽核方法的任一实施例。
62.该接口505用于与其它设备进行通信。本领域技术人员可以理解,图3中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
63.其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
64.若检测到实人认证系统所上传的待检测视频,将所述待检测视频输入预设稽核模型;
65.通过所述预设稽核模型提取所述待检测视频中的关键帧画面,并识别所述关键帧画面中带有身份证信息和水印的画面,并且将其作为目标图像特征;
66.通过所述预设稽核模型计算所述目标图像特征的置信度,并判断所述置信度是否大于第一预设阈值;
67.若所述置信度大于所述第一预设阈值,则将所述待检测视频确认为不合规视频。
68.在一实施例中,所述处理器502还实现如下步骤:
69.获取预设待识别样本集,通过yolov5神经网络模型和所述预设待识别样本集对所述初始训练模型进行训练以获得正样本集和负样本集;
70.通过所述正样本集和所述负样本集对所述初始训练模型进行训练以获得所述预设稽核模型。
71.在一实施例中,处理器502在实现所述获取预设训练集的步骤时,具体实现如下步骤:
72.获取预设训练视频,并提取所述预设训练视频中的所有光流视频帧;
73.将所有所述光流视频帧中光流移动次数最少的光流视频帧作为关键帧;
74.对所述关键帧中带有所述身份证信息和所述水印的区域进行标注以获得所述带有标注的图片,并将所有所述带有标注的图片作为所述预设训练集。
75.在一实施例中,处理器502在实现所述通过神经网络模型和所述预设训练集中带有标注的图片对所述预设训练集进行训练以获得所述预设稽核模型的步骤时,具体实现如下步骤:
76.获取预设待识别样本集,通过yolov5神经网络模型和所述预设待识别样本集对所述初始训练模型进行训练以获得正样本集和负样本集;
77.通过所述正样本集和所述负样本集对所述初始训练模型进行训练以获得所述预
设稽核模型。
78.在一实施例中,处理器502在实现所述通过所述正样本集和所述负样本集对所述初始训练模型进行训练以获得所述预设稽核模型的步骤时,具体实现如下步骤:
79.通过所述负样本集对所述初始训练模型进行训练以获得中间训练模型;
80.在所述正样本集中的图片上随机生成所述水印以获得目标正样本集;
81.通过所述目标正样本集对所述中间训练模型进行训练以获得所述预设稽核模型。
82.在一实施例中,处理器502在实现所述通过所述预设稽核模型提取所述待检测视频中的关键帧画面,并识别所述关键帧画面中带有身份证信息和水印的画面,并且将其作为目标图像特征的步骤时,具体实现如下步骤:
83.通过所述预设稽核模型并按照预设提取规则提取所述待检测视频中的关键帧画面;
84.识别所述关键帧画面中带有所述身份证信息和所述水印的区域并将其作为所述目标图像特征。
85.在一实施例中,处理器502在实现所述通过所述预设稽核模型计算所述目标图像特征的置信度,并判断所述置信度是否大于第一预设阈值的步骤之后,还包括如下步骤:
86.若所述置信度小于所述第二预设阈值,则将所述待检测视频确认为合规视频;
87.若所述置信度大于所述第二预设阈值且小于所属第一预设阈值,则上报用户进行人工稽核。
88.应当理解,在本技术实施例中,处理器502可以是中央处理单元(central processingunit,cpu),该处理器502还可以是其他通用处理器、数字信号处理器(figital signal processor,fsp)、专用集成电路(application specific integratef circuit,asic)、现成可编程门阵列(fielf-programmable gatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
89.本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
90.因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序。该计算机程序当被处理器执行时实现上述实人认证的数据稽核方法的任一实施例。
91.所述存储介质可以是u盘、移动硬盘、只读存储器(reaf-onlymemory,rom)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
92.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
93.在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
94.本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
95.该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备执行本发明各个实施例所述方法的全部或部分步骤。
96.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
97.显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,尚且本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
98.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。