本发明涉及物流,尤其涉及一种数字孪生网络流量预测方法、装置、设备及存储介质。
背景技术:
1、目前物流转运中心数字孪生网络对流量进行预测通过采用历史网络流量数据进行分析和预测,基于流量预测结果使网络管理员可以更有效地分配现有的网络资源,优化网络配置,提高网络性能,减少网络拥堵和延迟。但在传统的物流转运中心数字孪生网络流量预测工作中,通常是基于人工经验和机器学习等技术进行建模,网络流量预测的准确率容易受到高峰期等因素影响,并且随着日益激增的数据量,现有的预测手段无法满足庞大数据量的计算,容易出现过拟合的问题。
2、可见,现有技术还有待改进和提高。
技术实现思路
1、为了克服现有技术的不足,本发明的目的在于提供一种数字孪生网络流量预测方法、装置、设备及存储介质,其可处理庞大的数据量,有效防止模型出现过拟合的问题。
2、本发明第一方面提供了一种数字孪生网络流量预测方法,包括:获取物流流转中心数字孪生网络的历史流量数据,并对历史流量数据进行预处理以得到流量训练数据;基于timegpt时间序列模型构建初始化模型,并对初始化模型进行参数配置,以得到基础预测模型;基于流量训练数据对基础预测模型进行训练处理,以得到流量预测模型;根据预设周期从物流流转中心数字孪生网络中获取更新流量数据,并根据更新流量数据对流量预测模型进行更新训练,以得到更新后的流量预测模型;获取物流流转中心数字孪生网络的实时流量数据,并基于更新后的流量预测模型和实时流量数据进行流量预测,以得到预测流量结果。
3、可选的,在本发明第一方面的第一种实现方式中,所述获取物流流转中心数字孪生网络的历史流量数据,并对历史流量数据进行预处理以得到流量训练数据,包括:从物流流转中心数字孪生网络中获取得到历史流量数据,并对历史流量数据进行解析,以得到时间戳信息、与时间戳信息对应的流量值信息和时间相关信息;分别对时间戳信息、流量值信息和时间相关信息进行数据清洗,以得到清洗数据;根据预设时间序列格式对清洗数据进行格式转换,以得到流量训练数据。
4、可选的,在本发明第一方面的第二种实现方式中,所述分别对时间戳信息、流量值信息和时间相关信息进行数据清洗,以得到清洗数据,包括:判断时间戳信息、流量值信息和时间相关信息是否存在缺失值,若存在缺失值,则基于插值法对缺失值进行填充,以得到填充修复信息;基于箱线图法判断时间戳信息、流量值信息和时间相关信息是否存在异常值,若存在异常值,则对异常值进行修正处理或删除处理,以得到修正信息;将填充修复信息和修正信息进行整合,并基于预设时间序列进行排序,以得到清洗数据。
5、可选的,在本发明第一方面的第三种实现方式中,所述根据预设时间序列格式对清洗数据进行格式转换,以得到流量训练数据,包括:基于to_datetime函数将清洗数据中的时间戳信息和时间相关信息转换为日期时间格式,以得到转换数据;基于matplotlib库和转换数据绘制生成流量时间序列图;基于流量时间序列图生成流量训练数据。
6、可选的,在本发明第一方面的第四种实现方式中,所述基于timegpt时间序列模型构建初始化模型,并对初始化模型进行参数配置,以得到基础预测模型,包括:获取timegpt时间序列模型的api接口,并通过api接口对timegpt时间序列模型进行初始化处理,以得到初始化模型;
7、获取流量训练数据的数据类型,并根据数据类型确定模型参数;基于模型参数设置初始化模型的网络结构和训练参数,以得到配置模型;为配置模型配置api密钥,以得到初始化模型。
8、可选的,在本发明第一方面的第五种实现方式中,所述基于流量训练数据对基础预测模型进行训练处理,以得到流量预测模型,包括:基于预设的权重比例将流量训练数据划分为流量训练集和流量验证集;通过流量训练集对基础预测模型进行迭代训练,并获取训练过程中的预测误差数据;根据预测误差数据对基础预测模型进行微调,并基于损失函数预测微调后的基础预测模型的预测效果,以得到结果最优的基础预测模型;通过验证集对结果最优的基础预测模型进行校验,以得到性能最优的基础预测模型作为流量预测模型。
9、可选的,在本发明第一方面的第六种实现方式中,所述根据预设周期从物流流转中心数字孪生网络中获取更新流量数据,并根据更新流量数据对流量预测模型进行更新训练,以得到更新后的流量预测模型,包括:获取物流流转中心数字孪生网络的更新事件,并根据更新事件计算得到更新规律周期;根据更新规律周期从物流流转中心数字孪生网络中获取更新流量数据,并对更新流量数据进行数据清洗,以得到更新训练数据;基于增量学习法和更新训练数据对流量预测模型进行更新训练,以得到更新后的流量预测模型。
10、本发明第二方面提供了一种数字孪生网络流量预测装置,包括:预处理模块,用于获取物流流转中心数字孪生网络的历史流量数据,并对历史流量数据进行预处理以得到流量训练数据;配置模块,用于基于timegpt时间序列模型构建初始化模型,并对初始化模型进行参数配置,以得到基础预测模型;训练模块,用于基于流量训练数据对基础预测模型进行训练处理,以得到流量预测模型;更新模块,用于根据预设周期从物流流转中心数字孪生网络中获取更新流量数据,并根据更新流量数据对流量预测模型进行更新训练,以得到更新后的流量预测模型;预测模块,用于获取物流流转中心数字孪生网络的实时流量数据,并基于更新后的流量预测模型和实时流量数据进行流量预测,以得到预测流量结果。
11、可选的,在本发明第二方面的第一种实现方式中,所述预处理模块包括:解析单元,用于从物流流转中心数字孪生网络中获取得到历史流量数据,并对历史流量数据进行解析,以得到时间戳信息、与时间戳信息对应的流量值信息和时间相关信息;清洗单元,用于分别对时间戳信息、流量值信息和时间相关信息进行数据清洗,以得到清洗数据;转换单元,用于根据预设时间序列格式对清洗数据进行格式转换,以得到流量训练数据。
12、可选的,在本发明第二方面的第二种实现方式中,所述清洗单元包括:缺失部,用于判断时间戳信息、流量值信息和时间相关信息是否存在缺失值,若存在缺失值,则基于插值法对缺失值进行填充,以得到填充修复信息;异常部,用于基于箱线图法判断时间戳信息、流量值信息和时间相关信息是否存在异常值,若存在异常值,则对异常值进行修正处理或删除处理,以得到修正信息;整合部,用于将填充修复信息和修正信息进行整合,并基于预设时间序列进行排序,以得到清洗数据。
13、可选的,在本发明第二方面的第三种实现方式中,所述转换单元包括:转换部,用于基于to_datetime函数将清洗数据中的时间戳信息和时间相关信息转换为日期时间格式,以得到转换数据;绘制部,用于基于matplotlib库和转换数据绘制生成流量时间序列图;生成部,用于基于流量时间序列图生成流量训练数据。
14、可选的,在本发明第二方面的第四种实现方式中,所述配置模块包括:初始化单元,用于获取timegpt时间序列模型的api接口,并通过api接口对timegpt时间序列模型进行初始化处理,以得到初始化模型;参数单元,用于获取流量训练数据的数据类型,并根据数据类型确定模型参数;配置单元,用于基于模型参数设置初始化模型的网络结构和训练参数,以得到配置模型;密钥单元,用于为配置模型配置api密钥,以得到初始化模型。
15、可选的,在本发明第二方面的第五种实现方式中,所述训练模块包括:划分单元,用于基于预设的权重比例将流量训练数据划分为流量训练集和流量验证集;迭代单元,用于通过流量训练集对基础预测模型进行迭代训练,并获取训练过程中的预测误差数据;微调单元,用于根据预测误差数据对基础预测模型进行微调,并基于损失函数预测微调后的基础预测模型的预测效果,以得到结果最优的基础预测模型;校验单元,用于通过验证集对结果最优的基础预测模型进行校验,以得到性能最优的基础预测模型作为流量预测模型。
16、可选的,在本发明第二方面的第六种实现方式中,所述更新模块包括:周期单元,用于获取物流流转中心数字孪生网络的更新事件,并根据更新事件计算得到更新规律周期;过滤单元,用于根据更新规律周期从物流流转中心数字孪生网络中获取更新流量数据,并对更新流量数据进行数据清洗,以得到更新训练数据;更新单元,用于基于增量学习法和更新训练数据对流量预测模型进行更新训练,以得到更新后的流量预测模型。
17、本发明第三方面提供了一种数字孪生网络流量预测设备,所述数字孪生网络流量预测设备包括:存储器和至少一个处理器,所述存储器中存储有指令;至少一个所述处理器调用所述存储器中的所述指令,以使得所述数字孪生网络流量预测设备执行上述任一项所述的数字孪生网络流量预测方法的各个步骤。
18、本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,所述指令被处理器执行时实现上述任一项所述数字孪生网络流量预测方法的各个步骤。
19、本发明的技术方案中,通过获取并预处理历史流量数据,以及使用timegpt时间序列模型进行模型构建和训练,可以捕捉流量数据中的时间趋势和周期性变化,从而提高流量预测的准确性和可靠性;通过更新流量数据这种实时性数据对流量预测模型进行周期性更新可以确保预测模型始终基于最新的流量数据进行预测,从而提高预测的实时性和准确性,以防止流量预测模型出现过拟合的问题,使流量预测模型能够适应物流流转中心数字孪生网络中的流量变化,包括季节性变化、突发事件等,从而确保预测的准确性和有效性;通过准确的流量预测,物流流转中心可以更好地规划和管理资源;这有助于优化资源分配,提高物流效率,降低运营成本;基于预测流量结果,物流流转中心可以更加准确地评估未来流量情况,从而制定更加合理的决策和计划,这有助于提高决策效率和准确性,降低决策风险。