一种基于数据算法的点位落柜方法与流程

文档序号:35960766发布日期:2023-11-08 22:56阅读:40来源:国知局
一种基于数据算法的点位落柜方法与流程

本发明属于换电柜在城市中的布置,尤其涉及一种基于数据算法的点位落柜方法。


背景技术:

1、为了给快递业务、外卖业务提供更高效的换电补能方式,二轮车换电业务便孕育而生孕育而生。但是,如何在城市中寻找最佳的点位用于放置这些柜子,从而既方便用户换电,又能够有效提高换电柜的利用效率,成为了二轮车换电行业中的重要问题。传统上,这个问题通常是由人力来处理,既耗时耗力,又难以做到精准,且无法考虑到各种复杂因素下的最优解。


技术实现思路

1、发明目的:为了克服现有技术中存在的不足,本发明提供一种基于数据算法的点位落柜方法,基于大数据与人工智能技术构建落柜模型,根据落柜模型指导城市换电柜的选址,从而找到最佳落柜点。

2、技术方案:为实现上述目的,本发明的一种基于数据算法的点位落柜方法,具体步骤如下:

3、步骤s1:换电柜数据采集

4、通过爬虫获取不同品牌公开已有的站点和换电柜数据,包括站点位置、类型,将数据归一化处理后存入数据库;

5、步骤s2:城市地图数据生成

6、利用地图获取城市经纬度,根据经纬度将城市划分为若干区块,赋予各区块唯一id并存入数据库,对生成的地图区块进行临8域计算,获取临8域内容,对临8域内容进行拼接后存入数据库,并通过临8域计算构建落柜模型;

7、步骤s3:换电柜历史数据获取

8、通过爬虫获取换电柜历史数据,从中提取电池数据存入数据库;

9、步骤s4:外卖数据采集

10、通过爬虫获取公开的外卖数据,包括各区域的商家经纬度订单量、订单密度,并存入数据库;

11、步骤s5:数据聚合

12、将步骤s1至步骤s4中获取的数据进行聚合,生成能够在终端展示的预测区块落柜数、热力图经纬度、地图区块与落柜点位数据、区块详情数据,其中:

13、预测区块落柜数:基于历史柜效以及该区域电柜数,以及该区块外卖数据订单量获得该区域最大承载电柜数,以此判定该区块是否继续落柜;

14、热力图经纬度:基于外卖数据与地图区块数据,将区块范围内外卖商家与该商家订单量形成热力图以判定核心商区,并引导落柜向该商区靠拢;

15、地图区块与落柜点位数据:城市所有换电柜经纬度与判定地球球面上两点之间的距离及该点与边界点的距离的比值来判断该点是否在区域内,利用区块中心点与该换电柜之间的距离判断是否在该区块内部,以此获得每个换电柜对应的区块id,并记录存入数据库。

16、进一步地,在步骤s1中,换电柜数据采集的具体步骤如下:

17、1)确认需要获取的平台换电柜,基于爬虫获取公开的换电柜详尽的落点;

18、2)通过地图确认城市的经纬度范围,然后以a公里、b公里、c公里的距离间隔取点的经纬度,将该城市分割为一个个定点集;

19、3)根据定点集地图获取该城市的全部换电柜经纬度与名称,循环调取api,以定点为中心获取距离e-f米范围内的换电柜数据,并对获取到的数据统一数据结构;

20、4)数据清洗,将乱码文本进行编码和解码,将格式不规范的数据进行格式化处理,删除重复数据和无效信息,以便进一步处理和分析;

21、5)统一记录入库,标识清洗后存储到hive数据库中做数据分层,以便后续数据分析与处理。

22、进一步地,在步骤s2中,城市地图数据生成的具体步骤如下:

23、1)取gcj02地图坐标系获取全国各城市范围经纬度,并取该城市市政府经纬度为起始点;

24、2)以起始点为基础取上下左右四个点位,其中distance为距离,radians为计算弧度,earth_radius为地球半径;

25、使用

26、距离经度公式:distance*360/(2*π)/cos(radians(lat))/earth_radius

27、距离维度公式:distance*360/(2*π)/earth_radius

28、计算出对应四个点位的经纬度,取得四个点位后计算四个斜对角点位,分别为左上、右上、右下、左下,依据距离经度和距离纬度公式以及上下左右四个点位的经纬度计算出四个斜对角的点位,记录四个斜对角坐标,循环嵌套直至获取城市区块坐标;

29、3)限制区块计算范围,当点位坐标超出城市范围时停止下一次循环计算,限制范围为地图坐标系中该城市的经纬度范围,超过即停止;

30、4)经纬度二次校验,取经纬度顶点坐标,接入地图逆经纬度查询检验区块是否为该城市,否则移除该区块;

31、5)数据入库存储,并给予相应唯一id。

32、进一步地,在步骤s2中,临8域计算的具体步骤如下:

33、1)基于生成的地图正方形区块计算临近区块数据坐标,获取每个正方形区块i的中心点s,i表示正方形区块的序数;区块i顶点的经纬度为(lat1i,lng1i),右下角顶点的经纬度为(lat2i,lng2i),那么区块i的中心点纬度=(lat1i+lat2i)/2,中心点经度=(lng1i+lng2i)/2,按照以上方法计算全部区块的中心点,使用haversine公式来计算球体上两点之间的距离si:

34、si=2*asin(sqrt(sin((lngi2-lng1i)/2)^2+cos(lat1i)*cos(lat2i)*sin((lat2i-lat1i)/2)^2));

35、2)根据勾股定理,每个点位的临8域的所有中心点位距离应小于等于该区块的对角长,但不同地图距离计算存在一定误差,因此在区块对角长的基础上增加+0.1*边长距离作为判断计算临8域区域的依据,即:

36、si=si+0.1*√2/4*si

37、3)计算全量区块s中心点两两之间的距离,取所有在si的范围内的全量数据的中心点,即为临8域内容。

38、5、根据权利要求4所述的一种基于数据算法的点位落柜方法,其特征在于:在步骤s2中,临8域拼接的具体步骤如下:

39、1)计算出临8域的中心点后,取该中心点对应城市区块id汇总拼接,并整理出每个区块对应的临8域,留存记录;

40、2)存储mysql中将临8域与区块数据、区块中心点数据分放于同一个数据库,并记录备注。

41、进一步地,在步骤s2中,临8域模型计算的步骤如下:

42、1)数据收集和处理

43、收集临8域落柜数的历史数据,包括每个临8域的落柜数以及影响落柜数的气候条件和地理位置因素,同时,收集换电柜离线与在线画像数据,然后,使用pandas库将这些数据加载到dataframe中,并进行预处理和特征工程;

44、2)创建训练集和测试集

45、将数据集划分为训练集和测试集,采用随机划分的方式,将数据集的80%用作训练集,20%用作测试集;

46、3)模型训练

47、线性回归模型的函数为:

48、h_\theta(x)=\theta_0+\theta_1x_1+\theta_2x_2+...+\theta_n x_n

49、其中,h_\theta(x)表示通过模型预测得到的目标值,\theta=[\theta_0,\theta_1,

50、\theta_2,…,\theta_n]是模型的参数向量;

51、mse(\theta)=\frac{1}{2m}\sum_{i=1}^{m}(h_\theta(x_i)-y_i)^2

52、目标是最小化均方误差,通过调整参数\theta来使得mse(\theta)达到最小值;

53、梯度下降算法的参数更新规则如下:

54、\theta_j:=\theta_j-\alpha\frac{1}{m}\sum_{i=1}^{m}(h_\theta(x_i)-y_i)x_{ij}

55、其中,\alpha是学习率,控制每次更新的步长;

56、根据上述更新规则,重复迭代更新参数\theta,直到达到拟合程度;

57、4)验证模型

58、训练完成后,使用测试集的均方误差、决定系数来评估模型的性能,其中:决定系数用于衡量模型对目标变量的解释能力,其数学公式如下:

59、r^2=1-\frac{ss_{res}}{ss_{tot}}

60、其中,ss_{res}表示残差平方和,为模型预测值与实际值之间的差异的平方和,ss_{tot}表示总平方,为目标变量的总方差;

61、均方误差的公式为:

62、mse=\frac{1}{m}\sum_{i=1}^{m}(h_\theta(x_i)-y_i)^2

63、其中,h_\theta(x_i)表示模型预测的目标值,y_i表示实际目标值,m表示样本数量;

64、5)使用模型进行预测

65、通过迭代的参数\theta,预测新的临8域的落柜数,将模型保存下来,并在需要预测新数据时加载模型。

66、进一步地,在步骤s4中,外卖数据采集的具体步骤如下:

67、1)接入对应的外卖平台,获取授权后的api数据,集中获取城市内所有外卖商家的订单与店铺区域,并整理订单数、商家经纬度以及店铺id数据;

68、2)数据去重并整理后按城市落库留存,存储分层为ods层数据,以便后续应用。

69、进一步地,在步骤s5中,预测区块落柜数具体为:将外卖店铺经纬度定点、外卖订单数据、换电柜定点与区块数据进行聚合,通过外卖订单预估该区域订单承载上限,预设外卖单人单天订单量,取得该区域的需求配送人数,根据柜效与单柜服务人数获得该区域最大换电柜数,以此判定该区域是否进入或者退出。

70、进一步地,在步骤s5中,生成热力图经纬度的具体操作为:为兼容前端展示,后端处理时将数据整合为按热力图数据,展示方法为取原区块面积5%区块大小的区块拼合为一个整体不规则的区块数据,以此展示热力图信息,具体步骤如下:

71、i)按照城市地图数据生成的方式生成原区块5%大小的区块;

72、ii)将所有外卖店铺通过k-means整合为多个类簇,并将这些类簇存在的区块整合为一个不规则的多边形区块;

73、iii)使用轮滚法描绘区块的外围顶点的经纬度,并按照顺序以此排列;

74、iv)记录全量数据并录入数据。

75、有益效果:本发明的有益效果如下:

76、(1)大大减少了业务人员寻找落柜点位的时间和成本;

77、(2)帮助业务人员找到最佳的落柜点位,提高准确性;

78、(3)帮助相关企业优化落柜点位的布局,并且可以及时调整柜子的数量,以适应市场的变化。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1