【技术领域】
本发明涉及基架运维领域,尤其涉及一种基于大数据的数据处理方法和装置。
背景技术:
保险公司现有的车险业务对车险保费进行定价的方法是:人工根据车辆的使用年限信息对车险保费进行定价,这种方法存在的问题是:人工对车险保费进行定价效率较低并且主观因素较强。
技术实现要素:
有鉴于此,本发明实施例提供了一种基于大数据的数据处理方法和装置,用以解决人工对车险保费进行定价效率较低并且主观因素较强的问题。
本发明实施例提供了一种基于大数据的数据处理方法,所述方法包括:获取目标车辆的数据,所述目标车辆的数据至少包括所述目标车辆的历史数据和所述目标车辆的外观数据,所述目标车辆的历史数据包括以下至少之一:所述目标车辆的行驶里程数据、所述目标车辆的位置数据、所述目标车辆的事故记录数据,所述目标车辆的外观数据用于指示所述目标车辆的新旧程度;获取第一用户的属性数据,所述第一用户的属性数据至少包括所述第一用户的违法记录数据;根据所述目标车辆的数据和所述第一用户的属性数据计算风险分数;根据所述风险分数确定待支付金额;根据所述待支付金额生成电子保单;显示所述电子保单并提供支付通道;接收用于指示所述第一用户已支付的信息,确认支付成功。
进一步地,所述第一用户的属性数据还包括以下至少之一:所述第一用户的信用记录数据、所述第一用户的职业数据。
进一步地,所述根据所述目标车辆的数据和所述第一用户的属性数据计算风险分数,包括:根据所述目标车辆的数据计算所述目标车辆发生事故的概率,得到第一概率;根据所述第一用户的属性数据计算所述第一用户骗保的概率,得到第二概率;根据所述第一概率和所述第二概率确定所述风险分数。
进一步地,获取所述目标车辆的外观数据,包括:接收所述第一用户输入的所述目标车辆的车牌号码;接收所述第一用户上传的第一图像,所述第一图像为车辆图像;识别所述第一图像中的车牌号码;判断识别得到的车牌号码与所述第一用户输入的车牌号码是否相同;如果识别得到的车牌号码与所述第一用户输入的车牌号码不相同,则输出提示信息,所述提示信息用于提示上传的图像错误并提示所述第一用户上传所述目标车辆的图像;如果识别得到的车牌号码与所述第一用户输入的车牌号码相同,则显示所述目标车辆的图像;接收第二用户输入的所述目标车辆的外观数据。
进一步地,所述识别所述第一图像中所述目标车辆的车牌号码,包括:根据颜色定位方法和sobel定位方法从所述第一图像中提取出第二图像;识别所述第二图像中的字符,得到第一字符序列;判断所述第一字符序列中的所有字符在所述第二图像中是否全部位于同一行;如果所述第一字符序列中的所有字符在所述第二图像中不全部位于同一行,则根据所述第一字符序列确定所述目标车辆的车牌号码;如果所述第一字符序列中的所有字符在所述第二图像中全部位于同一行,从所述第一图像中提取出第三图像,所述第三图像为与所述第二图像相邻的区域;识别所述第三图像中的字符;如果未识别出任何字符,则根据所述第一字符序列确定所述目标车辆的车牌号码;如果识别得到第二字符序列,则根据所述第一字符序列和所述第二字符序列确定所述目标车辆的车牌号码。
本发明实施例提供了一种基于大数据的数据处理装置,所述装置包括:第一获取单元,用于获取目标车辆的数据,所述目标车辆的数据至少包括所述目标车辆的历史数据和所述目标车辆的外观数据,所述目标车辆的历史数据包括以下至少之一:所述目标车辆的行驶里程数据、所述目标车辆的位置数据、所述目标车辆的事故记录数据,所述目标车辆的外观数据用于指示所述目标车辆的新旧程度;第二获取单元,用于获取第一用户的属性数据,所述第一用户的属性数据至少包括所述第一用户的违法记录数据;计算单元,用于根据所述目标车辆的数据和所述第一用户的属性数据计算风险分数;确定单元,用于根据所述风险分数确定待支付金额;生成单元,用于根据所述待支付金额生成电子保单;显示单元,用于显示所述电子保单并提供支付通道;接收单元,用于接收用于指示所述第一用户已支付的信息,确认支付成功。
进一步地,所述第一用户的属性数据还包括以下至少之一:所述第一用户的信用记录数据、所述第一用户的职业数据。
进一步地,所述计算单元包括:第一计算子单元,用于根据所述目标车辆的数据计算所述目标车辆发生事故的概率,得到第一概率;第二计算子单元,用于根据所述第一用户的属性数据计算所述第一用户骗保的概率,得到第二概率;确定子单元,用于根据所述第一概率和所述第二概率确定所述风险分数。
进一步地,所述第一获取单元包括:第一接收子单元,用于接收所述第一用户输入的所述目标车辆的车牌号码;第二接收子单元,用于接收所述第一用户上传的第一图像,所述第一图像为车辆图像;识别子单元,用于识别所述第一图像中的车牌号码;判断子单元,用于判断识别得到的车牌号码与所述第一用户输入的车牌号码是否相同;输出子单元,用于如果识别得到的车牌号码与所述第一用户输入的车牌号码不相同,则输出提示信息,所述提示信息用于提示上传的图像错误并提示所述第一用户上传所述目标车辆的图像;显示子单元,用于如果识别得到的车牌号码与所述第一用户输入的车牌号码相同,则显示所述目标车辆的图像;第三接收子单元,用于接收第二用户输入的所述目标车辆的外观数据。
进一步地,所述识别子单元包括:第一提取模块,用于根据颜色定位方法和sobel定位方法从所述第一图像中提取出第二图像;第一识别模块,用于识别所述第二图像中的字符,得到第一字符序列;判断模块,用于判断所述第一字符序列中的所有字符在所述第二图像中是否全部位于同一行;第一确定模块,用于如果所述第一字符序列中的所有字符在所述第二图像中不全部位于同一行,则根据所述第一字符序列确定所述目标车辆的车牌号码;第二提取模块,用于如果所述第一字符序列中的所有字符在所述第二图像中全部位于同一行,从所述第一图像中提取出第三图像,所述第三图像为与所述第二图像相邻的区域;第二识别模块,用于识别所述第三图像中的字符;第二确定模块,用于如果未识别出任何字符,则根据所述第一字符序列确定所述目标车辆的车牌号码;第三确定模块,用于如果识别得到第二字符序列,则根据所述第一字符序列和所述第二字符序列确定所述目标车辆的车牌号码。
在本发明实施例中,获取目标车辆的数据,目标车辆的数据至少包括目标车辆的历史数据和目标车辆的外观数据,目标车辆的历史数据包括以下至少之一:目标车辆的行驶里程数据、目标车辆的位置数据、目标车辆的事故记录数据,目标车辆的外观数据用于指示目标车辆的新旧程度,获取第一用户的属性数据,第一用户的属性数据至少包括第一用户的违法记录数据,根据目标车辆的数据和第一用户的属性数据计算风险分数,根据风险分数确定待支付金额,不需要人工参与,解决了人工对车险保费进行定价效率较低并且主观因素较强的问题,提高了对车险保费进行定价的效率,并且,避免了人的主观因素的影响。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是根据本发明实施例一种可选的基于大数据的数据处理方法的流程图;
图2是根据本发明实施例一种可选的获取目标车辆的外观数据的流程图;
图3是图2中步骤s206的一种可选的具体步骤的流程图;
图4是根据本发明实施例一种可选的基于大数据的数据处理装置的示意图;
图5是本发明实施例提供的一种计算机设备的示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
请参见图1,所示为根据本发明一种可选的实施例的基于大数据的数据处理方法的流程图,包括以下步骤:
步骤s102,获取目标车辆的数据,目标车辆的数据至少包括目标车辆的历史数据和目标车辆的外观数据,目标车辆的历史数据包括以下至少之一:目标车辆的行驶里程数据、目标车辆的位置数据、目标车辆的事故记录数据,目标车辆的外观数据用于指示目标车辆的新旧程度。
在本发明实施例中,需要投保的车辆称为目标车辆。根据目标车辆的历史数据能够在一定程度上预测目标车辆接下来发生事故,或者说,发生故障的概率是大还是小。
如果目标车辆行驶里程数据非常大,则说明目标车辆可能已经使用了很久,或者,虽然使用的时间不长但是属于过度使用,这两种情况都可能会导致目标车辆接下来容易发生故障。
如果目标车辆的事故记录数据表明目标车辆发生过严重的交通事故,那么目标车辆发生故障的概率也比较大。
如果目标车辆的位置数据表明目标车辆长期在恶劣的自然环境下行驶,例如,在坑坑洼洼的路上,或在湿度很大的地区,或在温度很低的地区行驶,则目标车辆的状况也可能不容乐观,接下来容易发生故障。
如果目标车辆的外观比较新,则在一定程度上说明目标车辆使用年限较短,或者虽然使用年限较长但是养护得比较好。如果目标车辆的外观比较旧,则在一定程度上说明目标车辆使用年限较长,或者虽然使用年限较短但是养护得比较差。一般来说,外观较新的车辆比外观较旧的车辆更不容易发生故障。
步骤s104,获取第一用户的属性数据,第一用户的属性数据至少包括第一用户的违法记录数据。
在本发明实施例中,想要对目标车辆进行投保的用户为第一用户。
在一种实施方式中,第一用户的属性数据还可以包括以下至少之一:第一用户的信用记录数据、第一用户的职业数据。
第一用户的属性数据能够表明第一用户骗保的可能性有多大。
如果第一用户的属性数据表明第一用户没有违法记录,信用记录良好,则可以合理地认为第一用户是个遵纪守法的公民,骗保的可能性较小。
如果第一用户的属性数据表明第一用户有多次违法记录,信用记录差,无正当职业,则可以合理地认为第一用户的品行存在问题,骗保的可能性较大。
步骤s106,根据目标车辆的数据和第一用户的属性数据计算风险分数。
步骤s106具体可以包括以下步骤:根据目标车辆的数据计算目标车辆发生事故的概率,得到第一概率;根据第一用户的属性数据计算第一用户骗保的概率,得到第二概率;根据第一概率和第二概率确定风险分数。
在一种实施方式中,根据目标车辆的外观数据确定目标车辆发生故障的初始的概率p1,根据目标车辆的行驶里程数据、目标车辆的位置数据、目标车辆的事故记录数据中的至少一个调整概率p1,例如,如果目标车辆的行驶里程超过某一个预设的行驶里程,则提高概率p1;如果目标车辆经常在恶劣环境下行驶,则提高概率p1;如果目标车辆发生过严重的交通事故,则提高概率p1。
需要注意的是,根据目标车辆的行驶里程数据、目标车辆的位置数据、目标车辆的事故记录数据中的至少两个调整概率p1的过程中,不限定先后顺序,例如,假设根据目标车辆的位置数据、目标车辆的事故记录数据这两个因素调整概率p1,假设概率p1的初始值是30%,先根据目标车辆的位置数据将概率p1从30%提高到40%,再根据目标车辆的事故记录将概率p1从40%提高到55%;或者,先根据目标车辆的事故记录将概率p1从30%提高到45%,再根据目标车辆的位置数据将概率p1从45%提高到55%。
在一种实施方式中,设置基准的概率p2,如果第一用户有违法记录,则根据违法次数调整概率p2,违法记录越多,调整后概率p2越高;如果第一用户的信用记录差,则提高概率p2;如果第一用户无正当职业,则提高概率p2。
与上述调整概率p1的方式类似,调整概率p2的过程也不限定先后顺序。例如,根据第一用户的违法记录数据、第一用户的信用记录数据这两个因素调整概率p2,假设概率p2的初始值是10%,可以先根据第一用户的违法记录数据将概率p2从10%调整到40%,再根据第一用户的信用记录数据将概率p2从40%调整到60%;或者,也可以先根据第一用户的信用记录数据将概率p2从10%调整到30%,再根据第一用户的违法记录数据将概率p2从30%调整到60%。
根据第一概率和第二概率确定风险分数,具体可以是指对第一概率和第二概率进行加权平均,根据加权平均值确定风险分数。预先存储加权平均值与风险分数的映射关系,加权平均值与风险分数呈正相关的关系。
步骤s108,根据风险分数确定待支付金额。
预先存储风险分数与待支付金额的映射关系,风险分数越高,说明车辆出故障或第一用户骗保的概率越大,这种情况下待支付金额(即保费)越高。
例如,有两个第一用户,为方便起见,称为第一用户u1和第一用户u2,第一用户u1的信用记录良好,并且没有违法记录,第二用户u2有10次违法记录,并且信用记录差,第一用户u1对目标车辆c1投保,第二用户u2对目标车辆c2投保,假设目标车辆c1与目标车辆c2的外观数据和历史数据完全相同,那么目标车辆c1和目标车辆c2的第一概率的值相等。但是由于第二用户u2骗保的概率大,因此,第二用户u2的第二概率的值更大。因此,第二用户u2投保的风险分数更高,需要支付的保费更多。例如,投保相同的项目,第一用户u1只需要支付1000元保费,而第二用户u2需要支付8000元保费。
步骤s110,根据待支付金额生成电子保单。
步骤s112,显示电子保单并提供支付通道。
步骤s114,接收用于指示第一用户已支付的信息,确认支付成功。
在本发明实施例中,获取目标车辆的数据,目标车辆的数据至少包括目标车辆的历史数据和目标车辆的外观数据,目标车辆的历史数据包括以下至少之一:目标车辆的行驶里程数据、目标车辆的位置数据、目标车辆的事故记录数据,目标车辆的外观数据用于指示目标车辆的新旧程度,获取第一用户的属性数据,第一用户的属性数据至少包括第一用户的违法记录数据,根据目标车辆的数据和第一用户的属性数据计算风险分数,根据风险分数确定待支付金额,不需要人工参与,解决了人工对车险保费进行定价效率较低并且主观因素较强的问题,提高了对车险保费进行定价的效率,并且,避免了人的主观因素的影响。
由于本发明实施例提供的方法既考虑到车辆情况,也考虑到投保人的实际情况,因此达到了根据车辆情况和投保人实际情况共同确定保费的效果。
本发明实施例中,对于容易出故障的车辆,会提高保费;对于疑似骗保的保单,也会提高保费,使得骗保的人无利可图,从而打击了投保人骗保的现象。
并且,由于本发明实施例在确定保费的过程中,还将目标车辆的外观新旧程度考虑在内,由于车辆外观新旧比较直观并且难以造假,进一步提高了本发明实施例确定保费的合理性。
目标车辆的外观数据由人工评价得到,在本发明实施例中,目标车辆的外观数据由第二用户进行评价,第一用户可以是保险公司的工作人员。第一用户上传目标车辆的图像,第二用户根据该图像来评价目标车辆的新旧程度。需要注意的是,第一用户可能会故意上传非目标车辆的图像,例如,上传一辆外观更加新的车辆的图像来冒充目标车辆的图像。为了避免这种情况带来的损失,需要从用户上传的图像中识别出车牌号码,然后将识别出的车牌号码与用户输入的目标车辆的车牌号码进行比对,若二者相同,则说明用户上传的图像是目标车辆的图像;如果二者不同,则说明用户上传的图像不是目标车辆的图像,需要提醒用户上传目标车辆的图像。
请参见图2,获取目标车辆的外观数据的具体过程包括以下步骤:
步骤s202,接收第一用户输入的目标车辆的车牌号码。
步骤s204,接收第一用户上传的第一图像,第一图像为车辆图像。
步骤s206,识别第一图像中的车牌号码。
步骤s208,判断识别得到的车牌号码与第一用户输入的车牌号码是否相同。
步骤s210,如果识别得到的车牌号码与第一用户输入的车牌号码不相同,则输出提示信息,提示信息用于提示上传的图像错误并提示第一用户上传目标车辆的图像。
步骤s212,如果识别得到的车牌号码与第一用户输入的车牌号码相同,则显示目标车辆的图像。
步骤s214,接收第二用户输入的目标车辆的外观数据。
根据车牌中字符分布的位置,可以将车牌分成双层车牌和单层车牌。双层车牌,是指车牌号码分布于上下两行的车牌。单层车牌,是指车牌号码分布于一行的车牌。
目标车辆的车牌可能是双层车牌,也可能是单层车牌。
请参见图3,示出了图2中步骤s206的具体过程,包括:
步骤s302,根据颜色定位方法和sobel定位方法从第一图像中提取出第二图像。
第二图像是有比较大的概率包含车牌的区域。当然有可能第二图像仅包含部分的车牌,例如仅包含双层车牌的其中一层。
颜色定位是指在一幅图像中,寻找与车牌颜色相关的颜色区域,然后利用结构特征或者是纹理特征对该颜色区域进行判断,从而确定车牌所在区域。而sobel定位是通过对二值图像进行处理,寻找图像中的垂直区域进行定位的方法。由于车身颜色和车牌颜色有可能相同从而无法使用颜色定位,故采用颜色定位与sobel定位相结合的方式进行车牌所在区域的定位。
颜色定位包括:
(1)将图像的颜色空间由rgb根据公式转换为hsv,因为受到一定光照强度的影响,因此对图像使用直方图均衡进行预处理。rgb色彩模式是工业界的一种颜色标准,是通过对红(r)、绿(g)、蓝(b)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,rgb即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色系统之一。hsv(hue,saturation,value)是根据颜色的直观特性创建的一种颜色空间,也称六角锥体模型(hexconemodel)。这个模型中颜色的参数分别是:色调(h),饱和度(s),明度(v)。
(2)遍历图像中的像素,对h值在200-280之间,s和v均大于0.35的像素标记为白点像素,对其余像素标记为黑点像素。
(3)对第二步获取的二值图像使用闭操作,取轮廓等方法将车牌的外接矩形获取之后做进一步的处理。
sobel定位包括:
(1)高斯模糊:对图像进行去噪处理,可以让图像在后期处理中更容易的检测到边缘点,经过对比使用高斯和未使用高斯模糊,定位出“车牌”数量是不一样的,使用高斯模糊,车牌定位准确,不易产生多余定位结果,而未使用高斯模糊,则会定位出大量的无关矩形框。
(2)灰度化:边缘检测算法要求采用灰度化的环境,这一步的作用就是将彩色图像处理成灰度图像。
(3)sobel算子:检测灰度图像中的垂直边缘,以便区分车牌。sobel算子(sobeloperator,又称为一阶梯度算子)的算法是对灰度图像求垂直与水平方向的导数,以此来判断是否是垂直边缘。检测垂直边缘时,并未直接对图像求垂直与水平方向导数,而是使用了周边值得加权和方法,即“卷积”。
(4)二值化:对sobel算子生成的灰度图像中的每一个像素进行阈值处理,生成二值化图像。
(5)闭操作:将车牌字母连接成一个完成的矩形局域,方便接下来的取轮廓操作,闭操作会使图像的形态发生改变,通过使二值图像先膨胀再腐蚀,可使许多靠近的图块相连成无突起的连通域。
(6)取轮廓:取轮廓的目的是勾画连通域的外围,形成外接矩形。
(7)尺寸判断:排除不可能车牌的矩形区域。设置一个最大宽高比rmax和最小宽高比rmin,判断矩形区域是否在该宽高比之内即可判断该区域是否有可能是车牌。
(8)角度判断:目的是进一步排除不可能是车牌的区域,设定一个角度阈值,如果该区域旋转角度大于该阈值则舍弃该区域。
(9)旋转:将小于角度阈值的矩形调整到水平范围,便于统一尺寸。
(10)统一尺寸。
步骤s304,识别第二图像中的字符,得到第一字符序列。
第二图像可能同时包含上层车牌区域和下层车牌区域,也可能只包含上层车牌区域或下层车牌区域。
步骤s306,判断第一字符序列中的所有字符在第二图像中是否全部位于同一行。
步骤s308,如果第一字符序列中的所有字符在第二图像中不全部位于同一行,则根据第一字符序列确定车牌号码。
如果第一字符序列中的所有字符在第二图像中不全部位于同一行,则说明车牌是双层车牌,而且,第二图像中已经包括了双层车牌的上层车牌区域和下层车牌区域,并且,已经识别出双层车牌的上层车牌区域和下层车牌区域包括的字符,根据这些字符即可确定车牌号码。
步骤s310,如果第一字符序列中的所有字符在第二图像中全部位于同一行,从第一图像中提取出第三图像,第三图像为与第二图像相邻的区域。
如果第一字符序列中的所有字符在第二图像中全部位于同一行,则可能的情况有两种:
情况a:车牌为单层车牌,并且,已经识别出该单层车牌包含的字符。
情况b:车牌为双层车牌,但是第二图像仅包含双层车牌的其中一层,接下来还需要识别双层车牌的另一层中的字符。
至于是上述两种情况中的哪一种,还需要继续判断。可以理解,如果是情况b,那么第二图像未包含的那一层车牌所在的区域就在第二图像相邻的区域,即上述第三图像,因此,需要对第三图像进行识别。
步骤s312,识别第三图像中的字符。
步骤s314,如果未识别出任何字符,则根据第一字符序列确定车牌号码。
如果未识别出任何字符,则说明第三图像中不存在车牌区域,车牌为单层车牌。那么,根据第一字符序列确定车牌号码。
步骤s316,如果识别得到第二字符序列,则根据第一字符序列和第二字符序列确定车牌号码。
如果识别得到第二字符序列,则说明车牌是双层车牌,并且,第一字符序列和第二字符序分别为两层包括的字符,根据第三图像与第二图像之间的相对位置将第二字符序列与第一字符序列进行组合,得到车牌号码。
在本发明实施例中,通过对车辆图像的车牌号码进行识别,以判断用户上传的车辆图像是否为目标车辆的图像,如果用户上传的车辆图像不是目标车辆的图像,则提示用户上传的图像错误,并提示用户上传目标车辆的图像,如果用户又上传了其他车辆的图像,则继续提示用户,直至用户上传了目标车辆的图像,保险公司的工作人员可根据目标车辆的图像对目标车辆进行新旧程度的评价,从而为计算保费提供参考,从而增加了本发明实施例中计算保费的合理性和准确性。
请参见图4,所示为根据本发明实施例的一种可选的基于大数据的数据处理装置,该装置包括:第一获取单元41、第二获取单元42、计算单元43、确定单元44、生成单元45、显示单元46、接收单元47。
第一获取单元41,用于获取目标车辆的数据,目标车辆的数据至少包括目标车辆的历史数据和目标车辆的外观数据,目标车辆的历史数据包括以下至少之一:目标车辆的行驶里程数据、目标车辆的位置数据、目标车辆的事故记录数据,目标车辆的外观数据用于指示目标车辆的新旧程度。
第二获取单元42,用于获取第一用户的属性数据,第一用户的属性数据至少包括第一用户的违法记录数据。
计算单元43,用于根据目标车辆的数据和第一用户的属性数据计算风险分数。
确定单元44,用于根据风险分数确定待支付金额。
生成单元45,用于根据待支付金额生成电子保单。
显示单元46,用于显示电子保单并提供支付通道。
接收单元47,用于接收用于指示第一用户已支付的信息,确认支付成功。
可选地,第一用户的属性数据还包括以下至少之一:第一用户的信用记录数据、第一用户的职业数据。
可选地,计算单元43包括:第一计算子单元、第二计算子单元、确定子单元。
第一计算子单元,用于根据目标车辆的数据计算目标车辆发生事故的概率,得到第一概率。
第二计算子单元,用于根据第一用户的属性数据计算第一用户骗保的概率,得到第二概率。
确定子单元,用于根据第一概率和第二概率确定风险分数。
可选地,第一获取单元41包括:第一接收子单元、第二接收子单元、识别子单元、判断子单元、输出子单元、显示子单元、第三接收子单元。
第一接收子单元,用于接收第一用户输入的目标车辆的车牌号码。
第二接收子单元,用于接收第一用户上传的第一图像,第一图像为车辆图像。
识别子单元,用于识别第一图像中的车牌号码。
判断子单元,用于判断识别得到的车牌号码与第一用户输入的车牌号码是否相同。
输出子单元,用于如果识别得到的车牌号码与第一用户输入的车牌号码不相同,则输出提示信息,提示信息用于提示上传的图像错误并提示第一用户上传目标车辆的图像。
显示子单元,用于如果识别得到的车牌号码与第一用户输入的车牌号码相同,则显示目标车辆的图像。
第三接收子单元,用于接收第二用户输入的目标车辆的外观数据。
可选地,识别子单元包括:第一提取模块、第一识别模块、判断模块、第一确定模块、第二提取模块、第二识别模块、第二确定模块、第三确定模块。
第一提取模块,用于根据颜色定位方法和sobel定位方法从第一图像中提取出第二图像。
第一识别模块,用于识别第二图像中的字符,得到第一字符序列。
判断模块,用于判断第一字符序列中的所有字符在第二图像中是否全部位于同一行。
第一确定模块,用于如果第一字符序列中的所有字符在第二图像中不全部位于同一行,则根据第一字符序列确定目标车辆的车牌号码。
第二提取模块,用于如果第一字符序列中的所有字符在第二图像中全部位于同一行,从第一图像中提取出第三图像,第三图像为与第二图像相邻的区域。
第二识别模块,用于识别第三图像中的字符。
第二确定模块,用于如果未识别出任何字符,则根据第一字符序列确定目标车辆的车牌号码。
第三确定模块,用于如果识别得到第二字符序列,则根据第一字符序列和第二字符序列确定目标车辆的车牌号码。
本发明实施例提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行以下步骤:获取目标车辆的数据,目标车辆的数据至少包括目标车辆的历史数据和目标车辆的外观数据,目标车辆的历史数据包括以下至少之一:目标车辆的行驶里程数据、目标车辆的位置数据、目标车辆的事故记录数据,目标车辆的外观数据用于指示目标车辆的新旧程度;获取第一用户的属性数据,第一用户的属性数据至少包括第一用户的违法记录数据;根据目标车辆的数据和第一用户的属性数据计算风险分数;根据风险分数确定待支付金额;根据待支付金额生成电子保单;显示电子保单并提供支付通道;接收用于指示第一用户已支付的信息,确认支付成功。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:根据目标车辆的数据计算目标车辆发生事故的概率,得到第一概率;根据第一用户的属性数据计算第一用户骗保的概率,得到第二概率;根据第一概率和第二概率确定风险分数。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:接收第一用户输入的目标车辆的车牌号码;接收第一用户上传的第一图像,第一图像为目标车辆的图像;识别第一图像中目标车辆的车牌号码;判断识别得到的车牌号码与第一用户输入的车牌号码是否相同;如果识别得到的车牌号码与第一用户输入的车牌号码不相同,则输出提示信息,提示信息用于提示上传的图像错误并提示第一用户上传目标车辆的图像;如果识别得到的车牌号码与第一用户输入的车牌号码相同,则显示目标车辆的图像;接收第二用户输入的目标车辆的外观数据。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:根据颜色定位方法和sobel定位方法从第一图像中提取出第二图像;识别第二图像中的字符,得到第一字符序列;判断第一字符序列中的所有字符在第二图像中是否全部位于同一行;如果第一字符序列中的所有字符在第二图像中不全部位于同一行,则根据第一字符序列确定目标车辆的车牌号码;如果第一字符序列中的所有字符在第二图像中全部位于同一行,从第一图像中提取出第三图像,第三图像为与第二图像相邻的区域;识别第三图像中的字符;如果未识别出任何字符,则根据第一字符序列确定目标车辆的车牌号码;如果识别得到第二字符序列,则根据第一字符序列和第二字符序列确定目标车辆的车牌号码。
本发明实施例提供了一种计算机设备,包括存储器和处理器,存储器用于存储包括程序指令的信息,处理器用于控制程序指令的执行,程序指令被处理器加载并执行时实现以下步骤:获取目标车辆的数据,目标车辆的数据至少包括目标车辆的历史数据和目标车辆的外观数据,目标车辆的历史数据包括以下至少之一:目标车辆的行驶里程数据、目标车辆的位置数据、目标车辆的事故记录数据,目标车辆的外观数据用于指示目标车辆的新旧程度;获取第一用户的属性数据,第一用户的属性数据至少包括第一用户的违法记录数据;根据目标车辆的数据和第一用户的属性数据计算风险分数;根据风险分数确定待支付金额;根据待支付金额生成电子保单;显示电子保单并提供支付通道;接收用于指示第一用户已支付的信息,确认支付成功。
可选地,程序指令被处理器加载并执行时还实现以下步骤:根据目标车辆的数据计算目标车辆发生事故的概率,得到第一概率;根据第一用户的属性数据计算第一用户骗保的概率,得到第二概率;根据第一概率和第二概率确定风险分数。
可选地,程序指令被处理器加载并执行时还实现以下步骤:接收第一用户输入的目标车辆的车牌号码;接收第一用户上传的第一图像,第一图像为目标车辆的图像;识别第一图像中目标车辆的车牌号码;判断识别得到的车牌号码与第一用户输入的车牌号码是否相同;如果识别得到的车牌号码与第一用户输入的车牌号码不相同,则输出提示信息,提示信息用于提示上传的图像错误并提示第一用户上传目标车辆的图像;如果识别得到的车牌号码与第一用户输入的车牌号码相同,则显示目标车辆的图像;接收第二用户输入的目标车辆的外观数据。
可选地,程序指令被处理器加载并执行时还实现以下步骤:根据颜色定位方法和sobel定位方法从第一图像中提取出第二图像;识别第二图像中的字符,得到第一字符序列;判断第一字符序列中的所有字符在第二图像中是否全部位于同一行;如果第一字符序列中的所有字符在第二图像中不全部位于同一行,则根据第一字符序列确定目标车辆的车牌号码;如果第一字符序列中的所有字符在第二图像中全部位于同一行,从第一图像中提取出第三图像,第三图像为与第二图像相邻的区域;识别第三图像中的字符;如果未识别出任何字符,则根据第一字符序列确定目标车辆的车牌号码;如果识别得到第二字符序列,则根据第一字符序列和第二字符序列确定目标车辆的车牌号码。
图5是本发明实施例提供的一种计算机设备的示意图。如图5所示,该实施例的计算机设备50包括:处理器51、存储器52以及存储在存储器52中并可在处理器51上运行的计算机程序53,该计算机程序53被处理器51执行时实现实施例中的基于大数据的数据处理方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器51执行时实现实施例中基于大数据的数据处理装置中各模型/单元的功能,为避免重复,此处不一一赘述。
计算机设备50可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可包括,但不仅限于,处理器51、存储器52。本领域技术人员可以理解,图5仅仅是计算机设备50的示例,并不构成对计算机设备50的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算机设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器51可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器52可以是计算机设备50的内部存储单元,例如计算机设备50的硬盘或内存。存储器52也可以是计算机设备50的外部存储设备,例如计算机设备50上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器52还可以既包括计算机设备50的内部存储单元也包括外部存储设备。存储器52用于存储计算机程序以及计算机设备所需的其他程序和数据。存储器52还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。