一种基于海量数据分析模型的SIM卡流量最佳配置方法与流程

文档序号:31713136发布日期:2022-10-04 20:23阅读:来源:国知局

技术特征:
1.一种基于海量数据分析模型的sim卡流量最佳配置方法,其特征在于,包括以下步骤:s1,主动排查并采集异常的终端和sim卡;s2,双向数据比对并清洗sim卡关系;s3,建立特征库配置最佳sim卡流量方案。2.根据权利要求1所述的一种基于海量数据分析模型的sim卡流量最佳配置方法,其特征在于,所述步骤s1包括以下步骤:s11,将当月专变用户的负荷数据从采集系统中导出并计算采集率;s12,通过与营销系统内查询专变用户是否报停的信息进行对比,将采集率低于95%的终端列为采集异常的终端和sim卡记为第一数据库;s13,通过运营商提供的sim卡流量使用数据,排查出流量超出套餐用量两倍的sim卡,通过采集系统进行比对找到对应终端,将此类也列入采集异常的终端和sim卡记为第二数据库。3.根据权利要求1所述的一种基于海量数据分析模型的sim卡流量最佳配置方法,其特征在于,所述步骤s2包括以下步骤:s21,运营商数据和电力系统数据分别自查,在运营商数据侧,通过运营商提供的sim卡每月流量数据筛选出流量数据为0的sim卡记为第三数据库;s22,在电力数据侧,从营销系统中查询并导出ip地址与终端不匹配、存在错绑定的终端sim卡对应关系记为第四数据库;s23,结合上述双向数据,将第三数据库的sim卡号在采集系统中找出对应终端局号和户号后,在营销系统通过户号查找该用户是否属于暂停使用变压器用户,剔除暂停用户剩余的sim卡和终端视为异常卡记为第五数据库。4.根据权利要求1或2或3所述的一种基于海量数据分析模型的sim卡流量最佳配置方法,其特征在于,所述步骤s3包括以下步骤:s31,剔除异常数据,建立样本,将所有专变的终端和sim卡作为对象,剔除上述第一数据库至第五数据库的终端;s32,通过随机森林和向量机两种模型进行运算进行比较,选择随机森林模型作为最优模型;s33,计算不同终端的最大流量方案。5.根据权利要求4所述的一种基于海量数据分析模型的sim卡流量最佳配置方法,其特征在于,所述步骤s32具体为选取若干个样本作为样本数据集d,从一年的数据中心随机抽取,随机森林和向量机采用相同的样本数据,采用十折交叉验证方法,把数据集d随机分成容量相等的10份子集d1、d2、d3....和d10;取其中一份数据di作为测试数据集testdata i,剩下的9分作为训练数据集traindata i,构成第i组训练测试集合(testdata i,traindata i)(i=1,2,3...9,10),用10组训练集与测试集进行训练和测试,若满足训练与测试精度要求即可进行下一步计算,若不满足则需要设定参数或重新取样,根据测试精度和训练精度选取最优模型。6.根据权利要求4所述的一种基于海量数据分析模型的sim卡流量最佳配置方法,其特征在于,所述步骤s33具体为获取一个月的天气数据温度ti和湿度rhi,将用户的基本信息
拼接后形成样本xi(i=1,2,3....29,30),放入随机森林模型进行计算,得到下个月每天该用户的终端sim卡使用的流量yi,将每日流量进行相加后乘以允许误差系数得到最大月流量ymax,若ymax<15,则选择第一类物联卡套餐,若ymax>15且ymax<30则选择第二类物联卡套餐,若ymax>30,则对终端sim卡进行人工排查。7.根据权利要求3所述的一种基于海量数据分析模型的sim卡流量最佳配置方法,其特征在于,每月需对第四数据库和第五数据库的终端进行人工现场排查。

技术总结
本发明公开了一种基于海量数据分析模型的SIM卡流量最佳配置方法,一种基于海量数据分析模型的SIM卡流量最佳配置方法,包括以下步骤:S1,主动排查并采集异常的终端和SIM卡;S2,双向数据比对并清洗SIM卡关系;S3,建立特征库配置最佳SIM卡流量方案。通过用电信息采集系统、营销系统、PMS系统的电力数据和三大运营商提供的SIM卡流量数据,排查采集异常的终端和SIM卡,双向数据比对清洗SIM卡关系,同时建立基于专用变的采集设备数据流量使用特征库,寻找SIM卡使用特性,运用随机森林算法制作不同采集设备SIM卡流量使用模型,配置各类采集设备最佳SIM卡流量方案,本发明的配置方法能够选择合适的SIM卡套餐,节省大量用于SIM卡流量的费用。流量的费用。


技术研发人员:颜奔 叶彬 韩刘康 陈轩昂 龚超 刘一民 赵艳龙 吴成立 章志翔 周洲 孙沛芳 耿华潇
受保护的技术使用者:国网浙江省电力有限公司安吉县供电公司
技术研发日:2022.02.17
技术公布日:2022/10/3
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1