业务数据的预测方法、装置、设备及存储介质与流程

文档序号:23655598发布日期:2021-01-15 13:52阅读:157来源:国知局
业务数据的预测方法、装置、设备及存储介质与流程

本发明涉及人工智能的智能决策领域,尤其涉及一种业务数据的预测方法、装置、设备及存储介质。



背景技术:

随着业务量的剧增,对于业务量的规模和发展趋势的展望,需要对业务量的各项数据进行统计预测,例如:对业务数据的预测。目前的业务数据的预测方式,一般都是采用整合移动平均自回归模型(autoregressiveintegratedmovingaveragemodel,arima),根据arima模型中的时间序列预测算法和历史业务数据进行预设时间的业务数据预测,得到预测业务数据。

但是,上述业务数据的预测方式是直接将不同业务场景的历史业务数据融合在一起后进行预测,而不同业务场景的历史业务数据会有不同的预测规则,比如:新车、旧车的保费收取标准不一致,有各自业务场景的特殊性质,导致对业务数据预测的模型与业务场景的契合度较低,预测业务数据的偏差率较高,从而导致对业务数据进行预测的准确性低。



技术实现要素:

本发明提供一种业务数据的预测方法、装置、设备及存储介质,用于提高对业务数据进行预测的准确性。

本发明第一方面提供了一种业务数据的预测方法,包括:

通过预置的网络爬虫和定时采集调度任务,从预置网页中爬取业务订单数据和车辆销售数据;

对所述业务订单数据和所述车辆销售数据进行数据清洗和维度维值划分,得到新车数据和旧车数据;

对所述新车数据和所述旧车数据中的维度维值进行筛选和合并,得到预测维度;

通过预置预测模型、所述预测维度和预置预测指标,对所述新车数据在预设时段的业务数据进行预测,得到新车预测数据,以及对所述旧车数据在所述预设时段的业务数据进行多维度预测,得到各维度对应的初始旧车预测数据;

对所述新车预测数据和所述各维度对应的初始旧车预测数据进行合并处理,得到业务预测数据。

可选的,在本发明第一方面的第一种实现方式中,所述对所述业务订单数据和所述车辆销售数据进行数据清洗和维度维值划分,得到新车数据和旧车数据,包括:

分别对所述业务订单数据和所述车辆销售数据依次进行异常值剔除、空值填充、去重和维值更改,得到预处理业务订单数据和预处理车辆销售数据;

获取所述预处理车辆销售数据的新车标签和旧车标签,根据所述新车标签和所述旧车标签,对所述预处理业务订单数据和所述预处理车辆销售数据进行分类,得到初始新车业务订单数据、初始旧车业务订单数据、新车销售数据和旧车销售数据;

按照预设维度维值划分规则,分别对所述初始新车业务订单数据和所述初始旧车业务订单数据进行分类,得到目标新车业务订单数据和目标旧车业务订单数据;

将所述目标新车业务订单数据和所述新车销售数据确定为新车数据,将所述目标旧车业务订单数据和所述旧车销售数据确定为旧车数据。

可选的,在本发明第一方面的第二种实现方式中,所述通过预置预测模型、所述预测维度和预置预测指标,对所述新车数据在预设时段的业务数据进行预测,得到新车预测数据,以及对所述旧车数据在所述预设时段的业务数据进行多维度预测,得到各维度对应的初始旧车预测数据,包括:

统计所述新车数据的新车存量台数、新车业务率和新车单均业务费用数据,以及所述旧车数据的旧车存量台数、旧车同期单均业务费用数据、旧车单均业务降幅和旧车业务报废率;

通过预置预测模型、所述新车存量台数、所述新车业务率和所述新车单均业务费用数据,对所述新车数据在预设时段的业务数据进行预测,得到新车预测数据;

通过所述预置预测模型、所述旧车存量台数、所述旧车同期单均业务费用数据、所述旧车单均业务降幅和所述旧车业务报废率,对所述旧车数据在所述预设时段的业务数据进行预测,得到各维度对应的初始旧车预测数据。

可选的,在本发明第一方面的第三种实现方式中,所述通过所述预置预测模型、所述旧车存量台数、所述旧车同期单均业务费用数据、所述旧车单均业务降幅和所述旧车业务报废率,对所述旧车数据在所述预设时段的业务数据进行预测,得到各维度对应的初始旧车预测数据,包括:

通过所述预置预测模型、所述旧车存量台数、所述旧车同期单均业务费用数据和所述旧车单均业务降幅,对所述旧车数据在所述预设时段的业务数据进行预测,得到第一维度旧车预测数据;

通过所述预置预测模型、所述旧车存量台数、所述旧车同期单均业务费用数据、所述旧车单均业务降幅和所述旧车业务报废率,对所述旧车数据在所述预设时段的业务数据进行预测,得到第二维度旧车预测数据;

将所述第一维度旧车预测数据和所述第二维度旧车预测数据,确定为各维度对应的初始旧车预测数据。

可选的,在本发明第一方面的第四种实现方式中,所述通过预置的网络爬虫和定时采集调度任务,从预置网页中爬取业务订单数据和车辆销售数据,包括:

根据预置的定时采集调度任务对预设采集时间进行计时,当计时到所述预设采集时间时,调用预置的网络爬虫;

通过所述网络爬虫检测预置网页中的数据更新时间,并判断所述数据更新时间是否为预设的目标更新时段;

若所述数据更新时间为预设的目标更新时段,则从所述预置网页中爬取对应的业务订单数据和车辆销售数据。

可选的,在本发明第一方面的第五种实现方式中,所述对所述新车预测数据和所述各维度对应的初始旧车预测数据进行合并处理,得到业务预测数据,包括:

对所述各维度对应的初始旧车预测数据进行矩阵相加,得到目标旧车预测数据;

按照预设权重,将所述新车预测数据和所述目标旧车预测数据进行融合处理,得到业务预测数据。

可选的,在本发明第一方面的第六种实现方式中,所述对所述新车预测数据和所述各维度对应的初始旧车预测数据进行合并处理,得到业务预测数据之后,还包括:

获取所述业务预测数据的偏差率,根据所述偏差率和预置的优化算法,对所述预置预测模型进行优化。

本发明第二方面提供了一种业务数据的预测装置,包括:

爬取模块,用于通过预置的网络爬虫和定时采集调度任务,从预置网页中爬取业务订单数据和车辆销售数据;

数据清洗模块,用于对所述业务订单数据和所述车辆销售数据进行数据清洗和维度维值划分,得到新车数据和旧车数据;

筛选合并模块,用于对所述新车数据和所述旧车数据中的维度维值进行筛选和合并,得到预测维度;

预测模块,用于通过预置预测模型、所述预测维度和预置预测指标,对所述新车数据在预设时段的业务数据进行预测,得到新车预测数据,以及对所述旧车数据在所述预设时段的业务数据进行多维度预测,得到各维度对应的初始旧车预测数据;

合并处理模块,用于对所述新车预测数据和所述各维度对应的初始旧车预测数据进行合并处理,得到业务预测数据。

可选的,在本发明第二方面的第一种实现方式中,所述数据清洗模块具体用于:

分别对所述业务订单数据和所述车辆销售数据依次进行异常值剔除、空值填充、去重和维值更改,得到预处理业务订单数据和预处理车辆销售数据;

获取所述预处理车辆销售数据的新车标签和旧车标签,根据所述新车标签和所述旧车标签,对所述预处理业务订单数据和所述预处理车辆销售数据进行分类,得到初始新车业务订单数据、初始旧车业务订单数据、新车销售数据和旧车销售数据;

按照预设维度维值划分规则,分别对所述初始新车业务订单数据和所述初始旧车业务订单数据进行分类,得到目标新车业务订单数据和目标旧车业务订单数据;

将所述目标新车业务订单数据和所述新车销售数据确定为新车数据,将所述目标旧车业务订单数据和所述旧车销售数据确定为旧车数据。

可选的,在本发明第二方面的第二种实现方式中,所述预测模块包括:

统计单元,用于统计所述新车数据的新车存量台数、新车业务率和新车单均业务费用数据,以及所述旧车数据的旧车存量台数、旧车同期单均业务费用数据、旧车单均业务降幅和旧车业务报废率;

第一预测单元,用于通过预置预测模型、所述新车存量台数、所述新车业务率和所述新车单均业务费用数据,对所述新车数据在预设时段的业务数据进行预测,得到新车预测数据;

第二预测单元,用于通过所述预置预测模型、所述旧车存量台数、所述旧车同期单均业务费用数据、所述旧车单均业务降幅和所述旧车业务报废率,对所述旧车数据在所述预设时段的业务数据进行预测,得到各维度对应的初始旧车预测数据。

可选的,在本发明第二方面的第三种实现方式中,所述第二预测单元具体用于:

通过所述预置预测模型、所述旧车存量台数、所述旧车同期单均业务费用数据和所述旧车单均业务降幅,对所述旧车数据在所述预设时段的业务数据进行预测,得到第一维度旧车预测数据;

通过所述预置预测模型、所述旧车存量台数、所述旧车同期单均业务费用数据、所述旧车单均业务降幅和所述旧车业务报废率,对所述旧车数据在所述预设时段的业务数据进行预测,得到第二维度旧车预测数据;

将所述第一维度旧车预测数据和所述第二维度旧车预测数据,确定为各维度对应的初始旧车预测数据。

可选的,在本发明第二方面的第四种实现方式中,所述爬取模块具体用于:

根据预置的定时采集调度任务对预设采集时间进行计时,当计时到所述预设采集时间时,调用预置的网络爬虫;

通过所述网络爬虫检测预置网页中的数据更新时间,并判断所述数据更新时间是否为预设的目标更新时段;

若所述数据更新时间为预设的目标更新时段,则从所述预置网页中爬取对应的业务订单数据和车辆销售数据。

可选的,在本发明第二方面的第五种实现方式中,所述合并处理模块具体用于:

对所述各维度对应的初始旧车预测数据进行矩阵相加,得到目标旧车预测数据;

按照预设权重,将所述新车预测数据和所述目标旧车预测数据进行融合处理,得到业务预测数据。

可选的,在本发明第二方面的第六种实现方式中,所述业务数据的预测装置,还包括:

优化模块,用于获取所述业务预测数据的偏差率,根据所述偏差率和预置的优化算法,对所述预置预测模型进行优化。

本发明第三方面提供了一种业务数据的预测设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述业务数据的预测设备执行上述的业务数据的预测方法。

本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的业务数据的预测方法。

本发明提供的技术方案中,通过预置的网络爬虫和定时采集调度任务,从预置网页中爬取业务订单数据和车辆销售数据;对业务订单数据和车辆销售数据进行数据清洗和维度维值划分,得到新车数据和旧车数据;对新车数据和旧车数据中的维度维值进行筛选和合并,得到预测维度;通过预置预测模型、预测维度和预置预测指标,对新车数据在预设时段的业务数据进行预测,得到新车预测数据,以及对旧车数据在预设时段的业务数据进行多维度预测,得到各维度对应的初始旧车预测数据;对新车预测数据和各维度对应的初始旧车预测数据进行合并处理,得到业务预测数据。本发明实施例中,通过网络爬虫和定时采集调度任务,从预置网页中爬取业务订单数据和车辆销售数据,丰富了业务订单数据和车辆销售数据的多样性,能够使得业务订单数据和车辆销售数据结合不同的业务场景,从而提高了对业务数据的预测准确性,通过对业务订单数据和车辆销售数据进行数据清洗、维度维值划分,得到新车数据和旧车数据,以及获取预测维度,能够使得业务订单数据和车辆销售数据对新车和旧车的业务场景进行不同预测维度的预测,提高了预置预测模型与新车和旧车的业务场景的契合度,通过对新车预测数据和各维度对应的初始旧车预测数据进行合并处理,得到业务预测数据,综合了多个预测维度和不同业务场景的预测结果,降低了预测结果的偏差率,从而提高了对业务数据进行预测的准确性。

附图说明

图1为本发明实施例中业务数据的预测方法的一个实施例示意图;

图2为本发明实施例中业务数据的预测方法的另一个实施例示意图;

图3为本发明实施例中业务数据的预测装置的一个实施例示意图;

图4为本发明实施例中业务数据的预测装置的另一个实施例示意图;

图5为本发明实施例中业务数据的预测设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种业务数据的预测方法、装置、设备及存储介质,提高了对业务数据进行预测的准确性。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中业务数据的预测方法的一个实施例包括:

101、通过预置的网络爬虫和定时采集调度任务,从预置网页中爬取业务订单数据和车辆销售数据。

可以理解的是,本发明的执行主体可以为业务数据的预测装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

例如,业务订单数据可以为保费订单数据,预置网页的数量可为一个或一个以上,服务器执行定时采集调度任务,当定时采集调度任务计时到预设时刻时,调用预置计算机程序设计语言python网络爬虫,从车险订单管理系统的预置网页中爬取保费订单数据,从车辆销售管理系统的预置网页中爬取车辆销售数据;也可从保费订单数据和车辆销售数据的综合管理系统的预置网页中爬取保费订单数据和车辆销售数据,其中,保费订单数据可为月度数据、季度数据或年度数据,保费订单数据包括多辆车辆的客户基本信息、车辆信息和车险订单信息,保费订单数据为各省份的数据和定义的科目数据。车辆销售数据可为月度数据、季度数据或年度数据,车辆销售数据包括车辆类型、车辆类型对应的车辆销售量和车辆销售信息,车辆销售数据为各省份的数据和定义的科目数据。

102、对业务订单数据和车辆销售数据进行数据清洗和维度维值划分,得到新车数据和旧车数据。

例如,业务订单数据可以为保费订单数据,服务器得到保费订单数据和车辆销售数据后,对保费订单数据和车辆销售数据进行数据清洗、脱敏处理、归类和汇总,得到初始预处理的保费订单数据和车辆销售数据,其中,归类为按照车险行业常用的分类类型对保费订单数据和车辆销售数据进行归类,汇总,将归类后的保费订单数据和车辆销售数据进行相加汇总;

对初始预处理的保费订单数据和车辆销售数据进行维度维值划分,如:将保费订单数据划分为3个维度7个维值的数据:交强险/商业险,家用车/商用车,新车/续保/转保,得到保费订单数据中的新车的保费数据,将保费订单数据划分为3个维度7个维值的数据:交强险/商业险,家用车/商用车,旧车/续保/转保,得到保费订单数据中的旧车的保费数据,将车辆销售数据划分为1个维度2维值:新车/月度汽车销量,得到车辆销售数据中的新车的销售数据,将车辆销售数据划分为2个维度5维值:旧车/月度汽车销量、存量台数/报废率/单均降幅,得到车辆销售数据中的旧车的销售数据,保费订单数据中的新车的保费数据和车辆销售数据中的新车的销售数据为新车数据,保费订单数据中的旧车的保费数据和车辆销售数据中的旧车的销售数据为新车数据。

103、对新车数据和旧车数据中的维度维值进行筛选和合并,得到预测维度。

其中,预测维度的数量包括一个或一个以上。服务器获取新车数据和旧车数据中的初始维度维值,对初始维度维值进行筛选得到候选维度维值,按照预设合并规则将候选维度维值进行合并,得到预测维度,预测维度包括新车的预测维度和旧车的预测维度。

预设合并规则为同纬度合并、去重合并,例如:以新车数据的预测维度为例,服务器获得的初始维度维值为:交强险/商业险、家用车/商用车、新车/续保/转保,对初始维度维值进行筛选后得到的候选维度维值为:交强险/商业险、家用车/商用车、新车/续保/转保,按照预设合并规则将候选维度维值进行合并,得到预测维度为:交强商业、家用商用和新转续。

104、通过预置预测模型、预测维度和预置预测指标,对新车数据在预设时段的业务数据进行预测,得到新车预测数据,以及对旧车数据在预设时段的业务数据进行多维度预测,得到各维度对应的初始旧车预测数据。

例如,其中,预置预测指标为预先对新车数据和旧车数据的指标进行选择和确定的指标,比如:省份、保单数、保费收入和月度汽车销量等,服务器调用预置预测模型,该预置预测模型可为通过预置的连接方式将人工智能的多个机器学习神经网络模型进行连接而得的模型,也可为由多个深度学习模型的网络结构组合而成的模型,根据预置预测指标和新车数据(8月份的数据)计算新车上率和新车单均保费,根据新车上率和新车单均保费数据对9月份的新车保费收入数据进行预测,得到新车预测数据,根据预置预测指标和旧车数据(8月份的数据)计算旧车同期保单数、旧车单均保费、旧车单均保费降幅和旧车报废率,根据旧车同期保单数、旧车单均保费、旧车单均保费降幅和旧车报废率对9月份各预测维度的旧车保费收入数据进行预测,得到各维度对应的初始旧车预测数据。

105、对新车预测数据和各维度对应的初始旧车预测数据进行合并处理,得到业务预测数据。

例如,业务预测数据可以为保费预测数据,服务器通过分别将新车预测数据和各维度对应的初始旧车预测数据转换为矩阵向量,得到多个矩阵向量,将多个矩阵向量进行矩阵相加,得到保费预测数据,服务器也可通过将多个矩阵向量进行矩阵相乘,得到保费预测数据,服务器也可分别计算多个矩阵向量的权重矩阵值,将多个权重矩阵值进行相加,得到保费预测数据。

本发明实施例中,通过网络爬虫和定时采集调度任务,从预置网页中爬取业务订单数据和车辆销售数据,丰富了业务订单数据和车辆销售数据的多样性,能够使得业务订单数据和车辆销售数据结合不同的业务场景,从而提高了对业务数据的预测准确性,通过对业务订单数据和车辆销售数据进行数据清洗、维度维值划分,得到新车数据和旧车数据,以及获取预测维度,能够使得业务订单数据和车辆销售数据对新车和旧车的业务场景进行不同预测维度的预测,提高了预置预测模型与新车和旧车的业务场景的契合度,通过对新车预测数据和各维度对应的初始旧车预测数据进行合并处理,得到业务预测数据,综合了多个预测维度和不同业务场景的预测结果,降低了预测结果的偏差率,从而提高了对业务数据进行预测的准确性。

请参阅图2,本发明实施例中业务数据的预测方法的另一个实施例包括:

201、通过预置的网络爬虫和定时采集调度任务,从预置网页中爬取业务订单数据和车辆销售数据。

具体地,服务器根据预置的定时采集调度任务对预设采集时间进行计时,当计时到预设采集时间时,调用预置的网络爬虫;通过网络爬虫检测预置网页中的数据更新时间,并判断数据更新时间是否为预设的目标更新时段;若数据更新时间为预设的目标更新时段,则从预置网页中爬取对应的业务订单数据和车辆销售数据。

例如,业务订单数据可以为保费订单数据,预置的定时采集调度任务为每天23:59(预设采集时间),即每隔24小时,调用预置的网络爬虫,采用采集任务调度的机制对预置网页中的数据进行爬取,上一爬取的时刻为9月14日23:59,爬取的是7月份的数据,从9月14日23:59开始计时,当计时到9月15日23:59时,启动预置的采集调度指令来调用预置的网络爬虫,通过网络爬虫获取预置网页中操作日志,从操作日志获取数据的生成时间和存储时间,即数据更新时间,判断数据更新时间是否为新增月份(8月),即预设的目标更新时段,若是,则从预置页面中爬取8月份的保费订单数据和车辆销售数据,并保费订单数据和车辆销售数据存储至预置数据库,若否,则网络爬虫在预置页面中进行程序空跑。

202、对业务订单数据和车辆销售数据进行数据清洗和维度维值划分,得到新车数据和旧车数据。

具体地,服务器分别对业务订单数据和车辆销售数据依次进行异常值剔除、空值填充、去重和维值更改,得到预处理业务订单数据和预处理车辆销售数据;获取预处理车辆销售数据的新车标签和旧车标签,根据新车标签和旧车标签,对预处理业务订单数据和预处理车辆销售数据进行分类,得到初始新车业务订单数据、初始旧车业务订单数据、新车销售数据和旧车销售数据;按照预设维度维值划分规则,分别对初始新车业务订单数据和初始旧车业务订单数据进行分类,得到目标新车业务订单数据和目标旧车业务订单数据;将目标新车业务订单数据和新车销售数据确定为新车数据,将目标旧车业务订单数据和旧车销售数据确定为旧车数据。

例如,业务订单数据可以为保费订单数据,初始新车业务订单数据可以为初始新车保费订单数据,初始旧车业务订单数据可以为初始旧车保费订单数据,目标新车业务订单数据可以为目标新车保费订单数据,目标旧车业务订单数据可以为目标旧车保费订单数据,服务器通过分别对保费订单数据和车辆销售数据依次进行异常值剔除、空值填充、去重和维值更改,按照预设分类类型分别将维值更改后的保费订单数据和车辆销售数据进行分类,将分类后的保费订单数据和车辆销售数据进行矩阵相加的融合处理,得到预处理保费订单数据和预处理车辆销售数据,通过预置的标签提取算法提取预处理车辆销售数据中的标签,从标签中获取标识为新车的新车标签,以及标识为旧车的旧车标签,根据新车标签和旧车标签,对预处理保费订单数据中的车辆信息进行匹配,得到对应的初始新车保费订单数据和初始旧车保费订单数据,根据新车标签和旧车标签对车辆销售数据进行匹配,得到新车销售数据和旧车销售数据,预设维度维值划分规则包括新车数据划分的保费订单维度维值和旧车数据划分的保费订单维度维值,按照新车数据划分的保费订单维度维值,将初始新车保费订单数据进行划分,得到目标新车保费订单数据,按照旧车数据划分的保费订单维度维值,对初始旧车保费订单数据进行划分,得到目标旧车保费订单数据。

203、对新车数据和旧车数据中的维度维值进行筛选和合并,得到预测维度。

其中,预测维度的数量包括一个或一个以上。服务器获取新车数据和旧车数据中的初始维度维值,对初始维度维值进行筛选得到候选维度维值,按照预设合并规则将候选维度维值进行合并,得到预测维度,预测维度包括新车的预测维度和旧车的预测维度。

预设合并规则为同纬度合并、去重合并,例如:以新车数据的预测维度为例,服务器获得的初始维度维值为:交强险/商业险、家用车/商用车、新车/续保/转保,对初始维度维值进行筛选后得到的候选维度维值为:交强险/商业险、家用车/商用车、新车/续保/转保,按照预设合并规则将候选维度维值进行合并,得到预测维度为:交强商业、家用商用和新转续。

204、通过预置预测模型、预测维度和预置预测指标,对新车数据在预设时段的业务数据进行预测,得到新车预测数据,以及对旧车数据在预设时段的业务数据进行多维度预测,得到各维度对应的初始旧车预测数据。

具体地,服务器统计新车数据的新车存量台数、新车业务率和新车单均业务费用数据,以及旧车数据的旧车存量台数、旧车同期单均业务费用数据、旧车单均业务降幅和旧车业务报废率;通过预置预测模型、新车存量台数、新车业务率和新车单均业务费用数据,对新车数据在预设时段的业务数据进行预测,得到新车预测数据;通过预置预测模型、旧车存量台数、旧车同期单均业务费用数据、旧车单均业务降幅和旧车业务报废率,对旧车数据在预设时段的业务数据进行预测,得到各维度对应的初始旧车预测数据。

具体地,服务器通过预置预测模型、旧车存量台数、旧车同期单均业务费用数据和旧车单均业务降幅,对旧车数据在预设时段的业务数据进行预测,得到第一维度旧车预测数据;通过预置预测模型、旧车存量台数、旧车同期单均业务费用数据、旧车单均业务降幅和旧车业务报废率,对旧车数据在预设时段的业务数据进行预测,得到第二维度旧车预测数据;将第一维度旧车预测数据和第二维度旧车预测数据,确定为各维度对应的初始旧车预测数据。

例如,新车业务率为新车上险率,新车单均业务费用数据为新车单均保费数据,旧车同期单均业务费用数据可以为旧车同期单均保费数据,旧车单均业务降幅可以为旧车单均保费降幅,旧车业务报废率为旧车交强险报废率,服务器统计得到新车存量台数、新车上险率和新车单均保费数据,以及所述旧车数据的旧车存量台数、旧车同期单均保费数据、旧车单均保费降幅和旧车交强险报废率,通过预置预测模型中的预测算法,根据新车预测数据=新车存量台数*新车上险率*新车单均保费数据进行计算,得到新车预测数据,通过预置预测模型中的预测算法,根据第一维度旧车预测数据=旧车存量台数*旧车同期单均保费数据*(1-旧车单均保费降幅)进行计算,得到第一维度旧车预测数据,通过预置预测模型中的预测算法,根据第二维度旧车预测数据=旧车存量台数*旧车同期单均保费数据*(1-旧车单均保费降幅)*(1-旧车交强险报废率)进行计算,得到第二维度旧车预测数据,从而得到包含第一维度旧车预测数据和第二维度旧车预测数据的各维度对应的初始旧车预测数据。

205、对新车预测数据和各维度对应的初始旧车预测数据进行合并处理,得到业务预测数据。

具体地,服务器对各维度对应的初始旧车预测数据进行矩阵相加,得到目标旧车预测数据;按照预设权重,将新车预测数据和目标旧车预测数据进行融合处理,得到业务预测数据。

例如,业务预测数据可以为保费预测数据,服务器将各维度对应的初始旧车预测数据进行矩阵向量转换,得到矩阵a和矩阵b,新车预测数据为c,预设权重为0.5和0.5,可将矩阵a和矩阵b进行矩阵相加,得到目标旧车预测数据d=矩阵a+矩阵b,也可计算矩阵a和矩阵b分别与预置相加权重(0.4和0.6)的权重矩阵,得到矩阵a*0.4和矩阵b*0.6,将权重矩阵相加得到目标旧车预测数据d=矩阵a*0.4+矩阵b*0.6,按照预设权重,将新车预测数据c和目标旧车预测数据d进行融合处理,即计算e=0.5*c+0.5*d,得到保费预测数据e。

206、获取业务预测数据的偏差率,根据偏差率和预置的优化算法,对预置预测模型进行优化。

服务器获取预设时段的业务真实数据,计算业务真实数据与业务预测数据之间的偏差率;根据偏差率和预置的优化算法,对预置预测模型进行迭代更新。

例如,业务预测数据可以为保费预测数据,业务真实数据可以为保费真实数据,服务器获取8月份(预设时段)的保费真实数据,通过偏差率=(保费预测数据-保费真实数据)/保费真实数据,计算8月份的保费真实数据保费预测数据之间的偏差率,判断该偏差率是否大于预设阈值,若否,则不对预置预测模型进行更新,对该预置预测模型的预测结果进行实时的监测和判断,若是,则通过预置的优化算法,对预置预测模型的权重或模型结构参数进行迭代优化更新,或在预置预测模型的基础上建立新的数据分析模型,或对预置预测模型对保费预测数据的执行过程进行调整。通过对预置预测模型进行优化,提高了预置预测模型对保费预测数据的预测准确性。

本发明实施例中,不仅能够丰富业务订单数据和车辆销售数据的多样性,能够使得业务订单数据和车辆销售数据结合不同的业务场景,从而提高了对业务数据的预测准确性,能够使得业务订单数据和车辆销售数据对新车和旧车的业务场景进行不同预测维度的预测,提高了预置预测模型与新车和旧车的业务场景的契合度,综合了多个预测维度和不同业务场景的预测结果,降低了预测结果的偏差率,从而提高了对业务数据进行预测的准确性,还可以通过对预置预测模型进行优化,提高了预置预测模型的精度,从而提高了对业务数据进行预测的准确性。

上面对本发明实施例中业务数据的预测方法进行了描述,下面对本发明实施例中业务数据的预测装置进行描述,请参阅图3,本发明实施例中业务数据的预测装置一个实施例包括:

爬取模块301,用于通过预置的网络爬虫和定时采集调度任务,从预置网页中爬取业务订单数据和车辆销售数据;

数据清洗模块302,用于对业务订单数据和车辆销售数据进行数据清洗和维度维值划分,得到新车数据和旧车数据;

筛选合并模块303,用于对新车数据和旧车数据中的维度维值进行筛选和合并,得到预测维度;

预测模块304,用于通过预置预测模型、预测维度和预置预测指标,对新车数据在预设时段的业务数据进行预测,得到新车预测数据,以及对旧车数据在预设时段的业务数据进行多维度预测,得到各维度对应的初始旧车预测数据;

合并处理模块305,用于对新车预测数据和各维度对应的初始旧车预测数据进行合并处理,得到业务预测数据。

上述业务数据的预测装置中各个模块的功能实现与上述业务数据的预测方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。

本发明实施例中,通过网络爬虫和定时采集调度任务,从预置网页中爬取业务订单数据和车辆销售数据,丰富了业务订单数据和车辆销售数据的多样性,能够使得业务订单数据和车辆销售数据结合不同的业务场景,从而提高了对业务数据的预测准确性,通过对业务订单数据和车辆销售数据进行数据清洗、维度维值划分,得到新车数据和旧车数据,以及获取预测维度,能够使得业务订单数据和车辆销售数据对新车和旧车的业务场景进行不同预测维度的预测,提高了预置预测模型与新车和旧车的业务场景的契合度,通过对新车预测数据和各维度对应的初始旧车预测数据进行合并处理,得到业务预测数据,综合了多个预测维度和不同业务场景的预测结果,降低了预测结果的偏差率,从而提高了对业务数据进行预测的准确性。

请参阅图4,本发明实施例中业务数据的预测装置的另一个实施例包括:

爬取模块301,用于通过预置的网络爬虫和定时采集调度任务,从预置网页中爬取业务订单数据和车辆销售数据;

数据清洗模块302,用于对业务订单数据和车辆销售数据进行数据清洗和维度维值划分,得到新车数据和旧车数据;

筛选合并模块303,用于对新车数据和旧车数据中的维度维值进行筛选和合并,得到预测维度;

预测模块304,用于通过预置预测模型、预测维度和预置预测指标,对新车数据在预设时段的业务数据进行预测,得到新车预测数据,以及对旧车数据在预设时段的业务数据进行多维度预测,得到各维度对应的初始旧车预测数据;

合并处理模块305,用于对新车预测数据和各维度对应的初始旧车预测数据进行合并处理,得到业务预测数据;

优化模块306,用于获取业务预测数据的偏差率,根据偏差率和预置的优化算法,对预置预测模型进行优化。

可选的,数据清洗模块302还可以具体用于:

分别对业务订单数据和车辆销售数据依次进行异常值剔除、空值填充、去重和维值更改,得到预处理业务订单数据和预处理车辆销售数据;

获取预处理车辆销售数据的新车标签和旧车标签,根据新车标签和旧车标签,对预处理业务订单数据和预处理车辆销售数据进行分类,得到初始新车业务订单数据、初始旧车业务订单数据、新车销售数据和旧车销售数据;

按照预设维度维值划分规则,分别对初始新车业务订单数据和初始旧车业务订单数据进行分类,得到目标新车业务订单数据和目标旧车业务订单数据;

将目标新车业务订单数据和新车销售数据确定为新车数据,将目标旧车业务订单数据和旧车销售数据确定为旧车数据。

可选的,预测模块304包括:

统计单元3041,用于统计新车数据的新车存量台数、新车业务率和新车单均业务费用数据,以及旧车数据的旧车存量台数、旧车同期单均业务费用数据、旧车单均业务降幅和旧车业务报废率;

第一预测单元3042,用于通过预置预测模型、新车存量台数、新车业务率和新车单均业务费用数据,对新车数据在预设时段的业务数据进行预测,得到新车预测数据;

第二预测单元3043,用于通过预置预测模型、旧车存量台数、旧车同期单均业务费用数据、旧车单均业务降幅和旧车业务报废率,对旧车数据在预设时段的业务数据进行预测,得到各维度对应的初始旧车预测数据。

可选的,第二预测单元3043还可以具体用于:

通过预置预测模型、旧车存量台数、旧车同期单均业务费用数据和旧车单均业务降幅,对旧车数据在预设时段的业务数据进行预测,得到第一维度旧车预测数据;

通过预置预测模型、旧车存量台数、旧车同期单均业务费用数据、旧车单均业务降幅和旧车业务报废率,对旧车数据在预设时段的业务数据进行预测,得到第二维度旧车预测数据;

将第一维度旧车预测数据和第二维度旧车预测数据,确定为各维度对应的初始旧车预测数据。

可选的,爬取模块301还可以具体用于:

根据预置的定时采集调度任务对预设采集时间进行计时,当计时到预设采集时间时,调用预置的网络爬虫;

通过网络爬虫检测预置网页中的数据更新时间,并判断数据更新时间是否为预设的目标更新时段;

若数据更新时间为预设的目标更新时段,则从预置网页中爬取对应的业务订单数据和车辆销售数据。

可选的,合并处理模块305还可以具体用于:

对各维度对应的初始旧车预测数据进行矩阵相加,得到目标旧车预测数据;

按照预设权重,将新车预测数据和目标旧车预测数据进行融合处理,得到业务预测数据。

上述业务数据的预测装置中各模块和各单元的功能实现与上述业务数据的预测方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。

本发明实施例中,不仅能够丰富业务订单数据和车辆销售数据的多样性,能够使得业务订单数据和车辆销售数据结合不同的业务场景,从而提高了对业务数据的预测准确性,能够使得业务订单数据和车辆销售数据对新车和旧车的业务场景进行不同预测维度的预测,提高了预置预测模型与新车和旧车的业务场景的契合度,综合了多个预测维度和不同业务场景的预测结果,降低了预测结果的偏差率,从而提高了对业务数据进行预测的准确性,还可以通过对预置预测模型进行优化,提高了预置预测模型的精度,从而提高了对业务数据进行预测的准确性。

上面图3和图4从模块化功能实体的角度对本发明实施例中的业务数据的预测装置进行详细描述,下面从硬件处理的角度对本发明实施例中业务数据的预测设备进行详细描述。

图5是本发明实施例提供的一种业务数据的预测设备的结构示意图,该业务数据的预测设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessingunits,cpu)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对业务数据的预测设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在业务数据的预测设备500上执行存储介质530中的一系列指令操作。

业务数据的预测设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如windowsserve,macosx,unix,linux,freebsd等等。本领域技术人员可以理解,图5示出的业务数据的预测设备结构并不构成对业务数据的预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行业务数据的预测方法的步骤。

进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1