基于大数据回归分析算法扩展最佳缴费渠道的方法和装置的制造方法
【技术领域】
[0001] 本发明涉及扩展用户最佳缴费渠道技术领域,是一种基于大数据回归分析算法扩 展最佳缴费渠道的方法和装置。
【背景技术】
[0002] 针对电力企业扩展最佳缴费渠道的建设,是有效提升企业优质服务水平的重要举 措,是加快转变传统营销业务模式,推动企业营销工作快速健康发展的重要方式。
[0003] 通过对电力企业管辖区域居民的海量缴费信息进行深度挖掘分析,可以了解居民 选择日常缴费方式和缴费地点的习惯。例如:在电力营业厅,代理点,缴费终端,移动POS 机以及网络缴费终端缴纳电费。掌握各种电费缴纳渠道所承载的业务量,计算用户居住地 点与缴费网点的距离,为拓展缴费渠道提供了可靠的依据。现有缴费渠道的扩展方式不规 范,只是针对简单的缴费数据进行分析,导致现在的企业不能对海量数据进行快速的分析 处理,分析效率低,从而造成企业运营成本高。因此,急需一种规范、合理的扩展最佳缴费渠 道的方法。
【发明内容】
[0004] 本发明提供了一种基于大数据回归分析算法扩展最佳缴费渠道的方法和系统,克 服了上述现有技术之不足,其能有效解决现有缴费网点设置不合理造成因用户缴费不方 便,以致不能及时缴费甚至长期欠缴电费的问题;根据数据回归算法对居民缴费方式的选 择比例数据、各缴费渠道承载业务量数据、用户居住地点与缴费网点距离数据、区域人口密 度和各缴费渠道投资成本数据的计算分析,有效解决了电力企业现有技术针对海量数据分 析处理能力不够,造成分析计算效率低,运营成本高的问题。
[0005] 本发明的技术方案之一是通过以下措施来实现的:一种基于大数据回归分析算法 扩展最佳缴费渠道的方法,按照以下步骤进行: 步骤101,从大数据分布式数据库中读取存储的用电单位特征数据; 步骤201,在Map函数中进行数据回归分析计算,得到多个不同用户以数值形式存在的 缴费位置和缴费方式; 步骤301,将计算出的多个不同用户以数值形式存在的缴费位置和缴费方式在Reduce 函数下进行数值合并归一计算; 步骤401,通过数值归一计算结果再计算出离差平方和Q值,将离差平方和Q值与给定 阈值进行对比,判断离差平方和Q值是否满足小于给定阈值; 步骤501,当离差平方和Q值小于给定阈值时,则在得出最佳缴费位置和最佳缴费方式 后结束;当离差平方和Q值大于给定阈值时,则进入步骤201再次进行回归分析运算。
[0006] 下面是对上述发明技术方案的进一步优化或/和改进: 上述在步骤101中,大数据分布式数据库中的用电特征数据包括居民选择缴费方式比 例数据、各类缴费渠道承载业务量数据、用户居住地点与缴费网点距离数据、人口密度数据 以及各缴费渠道投资成本数据。
[0007] 上述在步骤201中,在Map函数中进行回归分析运算,线性回归方程通式为: Y^o+biXi+b^+baXa+··· +bkxk+u 其中,Y为因变量,即:缴费点位置或缴费方式,x :,?,?* · ·Χη为各个自变量,即:居 民选择的缴费方式比例数据、各类缴费渠道承载业务量数据、用户居住地点与缴费网点距 离数据、人口密度数据和各缴费渠道投资成本,b为各自变量的系数,U为随机扰动项观测 值, 当样本为i时,
η
[0008] 上述在步骤301中,用最小二乘法估算参数b。,!^,· · *bk,就是要选择参数 b。,!^,· · *,bk,使Y的观测值¥1与相应函数值轉的离差平方和达到最小,即:
[0009] 本发明的技术方案之二是通过以下措施来实现的:一种基于大数据回归分析算法 扩展最佳缴费渠道的装置,包括居民缴费特征数据导入模块、改进线性回归分析算法并发 处理模块和电力企业扩展缴费渠道的最佳投资分析结果输出模块,所述的改进线性回归分 析算法并发处理模块包括分布数据处理单元、回归方程计算单元和离差平方和回归分析计 算单元;居民缴费特征数据导入模块实现用户用电特征数据的读取,并将数据传输至改进 线性回归分析算法并发处理模块中,改进线性回归分析算法并发处理模块用于将用户用电 特征数据进行回归分析计算,并将计算结果进行归一后计算出离差平方和;所述的居民缴 费特征数据导入模块的数据输出端与分布数据处理单元的数据输入端相连接,分布数据处 理单元的数据输出端与回归方程计算单元的数据输入端相连接,回归方程计算单元的数据 输出端与离差平方和回归分析计算单元的数据输入端相连接,离差平方和回归分析计算单 元的数据输出端与电力企业扩展缴费渠道的最佳投资分析结果输出模块的数据输入端相 连接。
[0010] 本发明利用大数据平台进行技术改进,通过大数据处理平台并发分析海量数据, 可以通过供电单位提取5年以上的居民缴费方式信息明细数据,实现更大的数据吞吐量, 获取更为全面的用户特征数据。适用于大数据平台改进的回归分析算法并发分析海量用户 缴费数据,分析效率更高,更加准确的统计出用户缴纳电费的行为习惯,实现电力企业扩展 缴费渠道的最佳投资分析。
【附图说明】
[0011] 附图1为本发明实施例一的组成原理图。
[0012] 附图2为本发明实施例二的使用方法流程图。
[0013] 附图中的编码分别为:1为居民缴费特征数据导入模块,2为分布数据处理单元,3 为回归方程计算单元,4为离差平方和回归分析计算单元,5为电力企业扩展缴费渠道的最 佳投资分析结果输出模块。【具体实施方式】 本发明不受下述实施例的限制,可根据本发明的技术方案与实际情况来确定具体的实 施方式。
[0014] 在本发明中,为了便于描述,各部件的相对位置关系的描述均是根据说明书附图1 的布图方式来进行描述的,如:前、后、上、下、左、右等的位置关系是依据说明书附图的布图 方向来确定的。
[0015] 下面结合实施例及附图对本发明作进一步描述: 实施例一:如附图1所示,一种基于大数据回归分析算法扩展最佳缴费渠道的方法,按 照以下步骤进行: 步骤101,从大数据分布式数据库中读取存储的用电单位特征数据;步骤201,在Map函 数中进行数据回归分析计算,得到多个不同用户以数值形式存在的缴费位置和缴费方式; 步骤301,将计算出的多个不同用户以数值形式存在的缴费位置和缴费方式在Reduce函 数下进行数值合并归一计算;步骤401,通过数值归一计算结果计算出离差平方和Q值,将 离差平方和Q值与给定阈值进行对比,判断离差平方和Q值是否满足小于给定阈值;步骤 501,当离差平方和Q值小于给定阈值时,则在得出最佳缴费位置和最佳缴费方式后结束; 当离差平方和Q值大于给定阈值时,则进入步骤201再次进行回归分析运算。MapReduce计 算模型为现有公知技术,由Map函数和Reduce函数组成。MapReduce计算模型程序中的输 入、输出和中间数据都是以键值对(key, value)的形式存在,本发明使用MapReduce程序来 计算回归方程的矩阵系数和最后的离差平方和。本发明使用MapReduce计算模型改进线性 回归分析算法并发处理大规模的用户数据,实现电力企业扩展缴费渠道的最佳投资分析。
[0016] 可根据实际需要,对上述基于大数据回归分析算法扩展最佳缴费渠道的方法作进 一步优化或/和改进: 如附图1、2所示,在步骤101中,大数据分布式数据库中的用电特征数据包括居民选择 缴费方式比例数据、各类缴费渠道承载业务量数据、用户居住地点与缴费网点距离数据、人 口密度数据以及各缴费渠道投资成本数据。
[0017] 如附图1、2所示,在步骤201中,在Map函数中进行回归分析运算,线性回归方程 通式为: Y^o+biXi+b^+baXa+··· +bkxk+u 其中,Y为因变量,即:为缴费点位置或缴费方式,x i,x2, X3 ··· \为各个自变量,BP : 为居民选择的缴费方式比例数据、各类缴费渠道承载业务量数据、用户居住地点与缴费网 点距离数据、人口密度数据和各缴费渠道投资成本,b为各自变量的系数,U为随机扰动项 观测值; 当样本为i时,
[001 u」 旭过入m做Tn的Mapiteduce悮M进仃数做处埋,升田入数做TH ψ的HUFS模块 进行分布式处理。将待处理的海量用电单位用电特征数据和