一种基于机器学习的数据处理方法以及相关设备与流程

文档序号:18415077发布日期:2019-08-13 19:16阅读:208来源:国知局
一种基于机器学习的数据处理方法以及相关设备与流程

本申请涉及通信领域,尤其涉及一种基于机器学习的数据处理方法以及相关设备。



背景技术:

机器学习(machinelearning,ml)是一门多领域交叉学科,研究的是:计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。随着大数据时代的到来,机器学习尤其是适用于大规模数据的深度学习正得到越来越广泛的关注和应用,其中包括机器学习在无线通信网络中的应用。

机器学习可以包括数据采集、特征工程、训练、以及预测等步骤。在无线通信网络中,现有技术将这些步骤都融合在一个网元中执行,可将该网元称为网络数据分析(networkdataanalytics,nwda)网元。当nwda收集到足够数据并训练出模型后,将模型保存于nwda的网络实体,后续的预测过程是用户面功能(userplanefunction,upf)网元将预测所需的数据或者特征向量发送给nwda,由nwda预测出结果并发送给策略控制功能(policycontrolfunction,pcf)网元,pcf通过该预测结果生成策略,并将该生成策略下发给upf网元,其中生成策略可以为设置服务质量(qualityofservice,qos)参数等,由upf网元执行生效。

由于网络中存在很多的实时性业务的场景,其对业务处理的时延会要求很高,比如在无线接入网的无线资源管理(radioresourcemanagement,rrm)/无线传输技术(radiotransmissiontechnology,rtt)的各类算法中需要达到秒级甚至传输时间间隔(transmissiontimeinterval,tti)级(毫秒级)的业务处理。现有技术中,训练和预测融合在nwda网元执行,如图1所示。例如,nwda训练好模型后进行预测,包括:nwda接收来自upf网元的特征向量,并将该特征向量输入到训练好的模型中,得到预测结果,并将该预测结果发送给pcf,再由pcf生成与预测结果对应的策略并下发到相关的用户面网元来执行策略。而实际应用中,设备之间的每一次信息交互都可能存在时延,故现有技术中较多的交互使得时延也相应增加,针对实时性要求高的业务,影响了其业务体验。



技术实现要素:

本申请实施例提供了一种基于机器学习的数据处理方法以及相关设备,用于解决现有技术中由于交互时延增加所导致业务体验受到影响的问题。

本申请实施例的第一方面提供了一种基于机器学习的数据处理方法,包括:第一网元从第二网元接收算法模型的安装信息,其中,该第一网元可以是upf或者是基站,另外,第二网元用来训练算法模型;第一网元接收到算法模型的安装信息后,基于该安装信息安装算法模型;当算法模型成功安装在第一网元后,第一网元采集数据,并通过安装的算法模型对采集到的数据进行预测。本申请实施例中,将机器学习中的训练步骤由第二网元执行,第一网元安装算法模型,并根据该算法模型对第一网元采集到的数据进行预测,实现了将网络架构内模型训练和预测的逻辑功能分离,在第一网元采集到数据后,即可根据已安装的算法模型对数据进行预测,减少了交互时延,解决了现有技术中由于交互时延增加所导致业务体验受到影响的问题。

在一种可能的设计中,在本申请实施例第一方面的第一种实现方式中,算法模型的安装信息包括以下信息:算法模型的唯一标识id、算法模型的算法类型、算法模型的结构参数和算法模型的安装指示,其中,算法模型的安装指示用于指示第一网元安装该算法模型。本实现方式中,细化了安装信息中包括的内容,使得算法模型的安装更加详细可操作。

在一种可能的设计中,在本申请实施例第一方面的第二种实现方式中,算法模型的安装信息还包括策略索引信息,该策略索引信息包括算法模型的预测结果,和与该预测结果对应的策略的标识信息。本实现方式中,说明了算法模型的安装信息中还可以包括策略索引信息,使得第一网元可以根据该策略索引信息,找出与预测的结果对应的策略的标识信息,为第一网元根据预测结果确定策略提供了实现条件。

在一种可能的设计中,在本申请实施例第一方面的第三种实现方式中,在第一网元采集数据之前,第一网元从第二网元接收采集信息,该采集信息至少包括待采集特征的标识id。本实现方式中,第一网元还从第二网元接收采集信息,使得第一网元根据待采集特征的标识id,获取采集到的数据所对应的待采集特征的值,来进行预测。说明了第一网元进行预测所需要的参数的来源,增加了本申请实施例的可操作性。

在一种可能的设计中,在本申请实施例第一方面的第四种实现方式中,第一网元从第二网元接收采集信息之后,第一网元向第三网元发送采集信息和目标算法模型的唯一标识id,其中,目标算法模型为算法模型中的至少一个模型;第一网元再接收第三网元发送的与采集信息对应的目标特征向量和目标算法模型的唯一标识id,其中,目标算法模型用来对数据进行预测。本实现方式中,可以将采集目标特征向量的操作转给第三网元执行,而第一网元来执行根据模型进行预测的功能,减轻了第一网元的工作负荷。

在一种可能的设计中,在本申请实施例第一方面的第五种实现方式中,还可包括:第一网元向第四网元发送目标算法模型的唯一标识id,目标预测结果和与目标算法模型对应的目标策略索引信息,其中,目标预测结果用来确定目标策略,目标预测结果是将目标特征向量输入到目标算法模型所输出的结果;第一网元从第四网元接收目标策略的标识信息。本实现方式中,第一网元将根据目标预测结果确定目标策略的功能转给第四网元执行,不仅减轻了第一网元的工作负荷,同时结合第一方面的第四种实现方式,将不同的功能分别由多个网元来实现,也增加了网络的灵活性。

在一种可能的设计中,在本申请实施例第一方面的第六种实现方式中,算法模型安装成功后,还包括:第一网元从第二网元接收目标操作指示和算法模型的唯一标识id,目标操作指示用于指示第一网元对算法模型执行目标操作,其中,该目标操作可以包括但不限于以下操作中的任一种:修改算法模型,删除算法模型,激活算法模型或者去激活算法模型。本实现方式中,追加了再安装好算法模型后,还可以对该算法模型进行修改、删除等操作,更加顺应实际应用中可能会出现的各种需求,也可实现边缘设备免升级业务不中断。

在一种可能的设计中,在本申请实施例第一方面的第七种实现方式中,当目标操作为修改算法模型时,第一网元从第二网元接收修改后的算法模型的安装信息。本实现方式中,当需要修改算法模型时,第二网元还需向第一网元发送修改后的算法模型的安装信息来进行重新安装,使得本实施例在操作步骤上更加完善。

在一种可能的设计中,在本申请实施例第一方面的第八种实现方式中,当算法模型安装失败后,第一网元还要向第二网元发送安装失败原因指示,来告诉第二网元安装失败的原因。本实现方式中,若算法模型安装失败,则第一网元要反馈算法模型安装失败的原因,增加了本申请实施例的解决方案。

本申请实施例的第二方面提供了一种基于机器学习的数据处理方法,包括:第二网元获得训练完成的算法模型。在得到该算法模型后,第二网元向第一网元发送该算法模型的安装信息,使得第一网元根据该算法模型的安装信息来安装算法模型,其中算法模型用于预测第一网元采集到的数据,且第一网元为upf或者基站。本申请实施例中,将机器学习中的训练步骤由第二网元执行,第一网元安装算法模型,并根据该算法模型对第一网元采集到的数据进行预测,实现了将网络架构内模型训练和预测的逻辑功能分离,在第一网元采集到数据后,即可根据已安装的算法模型对数据进行预测,减少了交互时延,解决了现有技术中由于交互时延增加所导致业务体验受到影响的问题。

在一种可能的设计中,在本申请实施例第二方面的第一种实现方式中,算法模型的安装信息包括以下信息:算法模型的唯一标识id、算法模型的算法类型、算法模型的结构参数和算法模型的安装指示,其中,算法模型的安装指示用于指示第一网元安装该算法模型。本实现方式中,细化了安装信息中包括的内容,使得算法模型的安装更加详细可操作。

在一种可能的设计中,在本申请实施例第二方面的第二种实现方式中,算法模型的安装信息还包括策略索引信息,其中,策略索引信息包括算法模型的输出结果,和与输出结果对应的策略的标识信息。本实现方式中,说明了算法模型的安装信息中还可以包括策略索引信息,使得第一网元可以根据该策略索引信息,找出与预测的结果对应的策略的标识信息,为第一网元根据预测结果确定策略提供了实现条件。

在一种可能的设计中,在本申请实施例第二方面的第三种实现方式中,第二网元向第一网元发送算法模型的安装信息之后,当第一网元安装算法模型失败时,第二网元从第一网元接收安装失败原因指示。本实现方式中,若算法模型安装失败,则第二网元接收从第一网元反馈的算法模型安装失败的原因,使得本申请实施例更加具有可操作性。

在一种可能的设计中,在本申请实施例第二方面的第四种实现方式中,还包括:第二网元向第一网元发送采集信息,采集信息至少包括待采集特征的标识id。本实现方式中,通过第二网元发送的采集信息,使得第一网元根据待采集特征的标识id,获取采集到的数据所对应的待采集特征的值,来进行预测。说明了第一网元进行预测所需要的参数的来源,增加了本申请实施例的可操作性。

本申请实施例的第三方面提供了一种网元,该网元为第一网元,其中该第一网元可以为用户面网元upf或者基站,包括:第一收发单元,用于从第二网元接收算法模型的安装信息,第二网元用于训练算法模型;安装单元,用于根据收发单元接收的算法模型的安装信息,安装算法模型;采集单元,用于采集数据;预测单元,用于当安装单元安装算法模型成功后,根据算法模型对该采集单元采集的数据进行预测。本申请实施例中,将机器学习中的训练步骤由第二网元执行,安装单元安装算法模型,并由预测单元根据该算法模型对采集单元采集到的数据进行预测,实现了将网络架构内模型训练和预测的逻辑功能分离,在采集单元采集到数据后,预测单元即可根据已安装的算法模型对数据进行预测,减少了交互时延,解决了现有技术中由于交互时延增加所导致业务体验受到影响的问题。

在一种可能的设计中,在本申请实施例第三方面的第一种实现方式中,算法模型的安装信息包括以下信息:算法模型的唯一标识id、算法模型的算法类型、算法模型的结构参数和算法模型的安装指示,算法模型的安装指示用于指示安装算法模型。本实现方式中,细化了安装信息中包括的内容,使得算法模型的安装更加详细可操作。

在一种可能的设计中,在本申请实施例第三方面的第二种实现方式中,算法模型的安装信息还可以包括策略索引信息,策略索引信息包括算法模型的预测结果,和与预测结果对应的策略的标识信息。本实现方式中,说明了算法模型的安装信息中还可以包括策略索引信息,使得第一网元可以根据该策略索引信息,找出与预测的结果对应的策略的标识信息,为第一网元根据预测结果确定策略提供了实现条件。

在一种可能的设计中,在本申请实施例第三方面的第三种实现方式中,第一收发单元还用于:从第二网元接收采集信息,采集信息至少包括待采集特征的标识id。本实现方式中,第一收发单元还从第二网元接收采集信息,使得第一网元根据待采集特征的标识id,获取采集到的数据所对应的待采集特征的值,来进行预测。说明了第一网元进行预测所需要的参数的来源,增加了本申请实施例的可操作性。

在一种可能的设计中,在本申请实施例第三方面的第四种实现方式中,第二收发单元,用于向第三网元发送采集信息和目标算法模型的唯一标识id,其中,目标算法模型为算法模型中的至少一个模型;第二收发单元还用于,从第三网元接收与采集信息对应的目标特征向量和目标算法模型的唯一标识id,其中,目标算法模型用于执行预测操作。本实现方式中,可以将采集目标特征向量的操作转给第三网元执行,而第一网元来执行根据模型进行预测的功能,减轻了第一网元的工作负荷。

在一种可能的设计中,在本申请实施例第三方面的第五种实现方式中,第一网元还包括:第三收发单元,用于向第四网元发送目标算法模型的唯一标识id,目标预测结果和与目标算法模型对应的目标策略索引信息,其中目标预测结果用于目标策略的确定,目标预测结果为将目标特征向量输入至目标算法模型所得到的结果;第三收发单元还用于,从第四网元接收目标策略的标识信息。本实现方式中,将根据目标预测结果确定目标策略的功能转给第四网元执行,不仅减轻了第一网元的工作负荷,同时结合第一方面的第四种实现方式,将不同的功能分别由多个网元来实现,也增加了网络的灵活性。

在一种可能的设计中,在本申请实施例第三方面的第六种实现方式中,第一收发单元还用于:从第二网元接收目标操作指示和算法模型的唯一标识id,目标操作指示用于指示第一网元对算法模型执行目标操作,其中,目标操作包括修改算法模型,删除算法模型,激活算法模型或者去激活算法模型。本实现方式中,追加了再安装好算法模型后,还可以对该算法模型进行修改、删除等操作,更加顺应实际应用中可能会出现的各种需求,也可实现边缘设备免升级业务不中断。

在一种可能的设计中,在本申请实施例第三方面的第七种实现方式中,当目标操作为修改算法模型时,第一收发单元还用于:从第二网元接收修改后的算法模型的安装信息。本实现方式中,当需要修改算法模型时,第二网元还需向第一收发单元发送修改后的算法模型的安装信息来进行重新安装,使得本实施例在操作步骤上更加完善。

在一种可能的设计中,在本申请实施例第三方面的第八种实现方式中,当算法模型安装失败后,第一收发单元还用于:向第二网元发送安装失败原因指示。本实现方式中,若算法模型安装失败,则第一收发单元还要向第二网元反馈算法模型安装失败的原因,使得增加了本申请实施例的解决方案。

本申请实施例的第四方面提供了一种网元,该网元为第二网元,包括训练单元,用于获得训练完成的算法模型;收发单元,用于向第一网元发送训练完成的算法模型的安装信息,其中算法模型的安装信息用于算法模型的安装,算法模型用于数据预测,另外,第一网元为用户面网元upf或基站。本申请实施例中,将机器学习中的训练步骤由第二网元的训练单元执行,第一网元安装算法模型,并根据该算法模型对第一网元采集到的数据进行预测,实现了将网络架构内模型训练和预测的逻辑功能分离,在第一网元采集到数据后,即可根据已安装的算法模型对数据进行预测,减少了交互时延,解决了现有技术中由于交互时延增加所导致业务体验受到影响的问题。

在一种可能的设计中,在本申请实施例第四方面的第一种实现方式中,算法模型的安装信息包括以下信息:算法模型的唯一标识id、算法模型的算法类型、算法模型的结构参数和算法模型的安装指示,算法模型的安装指示用于指示第一网元安装算法模型。本实现方式中,细化了安装信息中包括的内容,使得算法模型的安装更加详细可操作。

在一种可能的设计中,在本申请实施例第四方面的第二种实现方式中,算法模型的安装信息还包括策略索引信息,其中,策略索引信息包括算法模型的输出结果,和与输出结果对应的策略的标识信息。本实现方式中,说明了算法模型的安装信息中还可以包括策略索引信息,使得第一网元可以根据该策略索引信息,找出与预测的结果对应的策略的标识信息,为第一网元根据预测结果确定策略提供了实现条件。

在一种可能的设计中,在本申请实施例第四方面的第三种实现方式中,收发单元还用于:当第一网元安装算法模型失败时,从第一网元接收安装失败原因指示。本实现方式中,若算法模型安装失败,则收发范元接收从第一网元反馈的算法模型安装失败的原因,使得本申请实施例更加具有可操作性。

在一种可能的设计中,在本申请实施例第四方面的第四种实现方式中,收发单元还用于:向第一网元发送采集信息,采集信息至少包括待采集特征的标识id。本实现方式中,通过第二网元的收发单元发送的采集信息,使得第一网元根据待采集特征的标识id,获取采集到的数据所对应的待采集特征的值,来进行预测。说明了第一网元进行预测所需要的参数的来源,增加了本申请实施例的可操作性。

本申请实施例的第五方面提供了一种通信装置,该通信装置具有实现上述方法设计中第一网元行为或者第二网元行为的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。该模块可以是软件和/或硬件。

在一种可能的实现方式中,该通信装置包括存储单元、处理单元以及通信单元。

其中,存储单元,用于存储该通信装置所需的程序代码和数据;处理单元,用于调用该程序代码,对该通信装置的动作进行控制管理;通信单元,用于支持通信装置与其他设备的通信。

在一个可能的实现方式中,该通信装置的结构中包括处理器、通信接口、存储器和总线,其中,通信接口、处理器以及存储器通过总线相互连接;通信接口用于支持通信装置与其他设备的通信,该存储器用于存储该通信装置所需的程序代码和数据,处理器用于调用该程序代码,支持第一网元或者第二网元执行如上述方法中相应的功能。

本申请实施例的第六方面提供了一种装置,该装置包括存储器,该存储器用于存储指令。当存储器存储的指令被处理器执行时,支持处理器实现上述第一网元或者第二网元执行上述方法中相应的功能,例如发送或处理上述方法中所涉及的数据和/或信息。该装置可以包括芯片,也可以包括芯片和其他分立器件。

本申请实施例的第七方面提供了一种系统,该系统包括前述第一方面的第一网元和第二方面的第二网元;或者,包括前述第三方面的第一网元和第四方面的第二网元。

本申请实施例的第八方面提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。

本申请的第九方面提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。

从以上技术方案可以看出,本申请实施例具有以下优点:第一网元从第二网元接收算法模型的安装信息,该第一网元为用户面网元upf或基站,该第二网元用于训练所述算法模型;第一网元根据算法模型的安装信息,安装该算法模型;当算法模型安装成功后,第一网元采集数据,根据算法模型对该数据进行预测。本申请实施例中,将机器学习中的训练步骤由第二网元执行,第一网元安装算法模型,并根据该算法模型对第一网元接收到的数据进行预测,实现了将网络架构内模型和预测的逻辑功能分离,在第一网元采集到数据后,即可根据已安装的算法模型对数据进行预测,减少了交互时延,解决了现有技术中由于交互时延增加所导致业务体验受到影响的问题。

附图说明

图1为现有技术中一种可能的基于机器学习的方法流程图;

图2a为一种可能的线性回归的示意图;

图2b为一种可能的logistics回归的示意图;

图2c为一种可能的cart分类的示意图;

图2d为一种可能的随机森林和决策树的示意图;

图2e为一种可能的svm分类的示意图;

图2f为一种可能的贝叶斯分类的示意图;

图2g为一种可能的神经网络模型结构的示意图;

图2h为本申请提供的一种可能的系统架构图;

图3为本申请实施例提供的一种可能的基于机器学习的数据处理方法的流程图;

图4为本申请实施例提供的另一可能的基于机器学习的数据处理方法的流程图;

图5为本申请实施例提供的一种可能的第一网元的实施例示意图;

图6为本申请实施例提供的一种可能的第二网元的实施例示意图;

图7为本申请实施例提供的一种通信装置的示意性框图;

图8为本申请实施例提供的一种通信装置的结构示意图;

图9为本申请实施例提供的一种系统的结构示意图。

实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。

随着机器学习的不断完善,使得我们有机会从海量数据集中提取潜在有用的信息和规律。机器学习的主要目的是提取有用的特征,然后根据已有的实例,构造从特征到标签的映射。其中,标签用于区别数据,而特征用于描述数据的特性,可以理解为,特征是对数据做出某个判断的依据,而标签是对数据所做出的结论。实际应用中,机器学习可以包括如下几个步骤:

步骤一、数据采集:是指从产生数据集的对象中获取各种类型的原始数据,存放在数据库或内存中用来进行训练或者预测。

步骤二、特征工程:特征工程(featureengineering,fe)是机器学习所特有的一个过程,其核心部分包括特征处理。其中特征处理包括对数据进行预处理,例如特征选择(featureselection,fs)和降维等。由于原始数据中存在大量的冗余的、不相关的、带噪声的特征,因此要对原始数据进行清洗、去重、去噪等操作。通过预处理,对原始数据做简单的结构化处理,提取训练数据的特征、相关性分析等。特征选择是减少冗余特征、不相关特征的有效手段。

步骤三、训练模型:将训练数据准备好后,选择合适的算法、特征以及标签。将选择的特征和标签,以及准备好的训练数据输入到算法后再由计算机执行训练算法。常见的算法包括逻辑回归、决策树、支持向量机(supportvectormachine,svm)等。每一个算法也可能会包括多个衍生的算法类型。单个训练算法训练结束后会产生一个机器学习模型。

步骤四、预测:将需要预测的样本数据输入到训练得到的机器学习模型中,可得到该模型输出的预测值。需要说明的是,基于不同的算法问题,该输出的预测值可能是一个的实数,也可能是一个分类结果。这个预测值就是机器学习所预测出的内容。

需要说明的是,在完成机器学习算法应用的过程中最重要的是数据的特征工程、算法的选择和分析预测出的结果所带来的有益效果。对于算法训练和预测过程中的中间过程和模型的结构可以看做黑盒的方式,而对于模型驱动的架构设计,则需要对通过不同的机器学习算法训练所产生的用于预测的模型,进行具体化、合并以及抽象。下面将分别对几种常见的机器学习算法进行简单描述。

1、回归算法

常见的回归算法包括线性回归,逻辑(logistics)回归等。其中线性回归是对连续因变量y与一个或多个预测变量x之间的关系进行建模的方法。如图2a所示,为一种可能的线性回归的示意图,线性回归的目的是预测数值型的目标值。训练回归算法模型的目的是求解回归系数,一旦有了这些系数再基于新的采样特征向量的输入就可以预测到目标数值。例如,用回归系数乘以输入特征向量值,再将乘积求和也就是求两者的内积,求和得到的结果就是预测值。预测模型可以通过如下公式表示:

z=w0x0+w1x1+w2x2+...+wnxn+n,

改写为向量形式,可以为z=wtx+b;

训练得到回归系数wt与常量项b,其中常量项b也是训练产生的,用来对模型做整体的调整与具体的某一个特征无关,b可以不存在即b=0,基于系数、常量项和新的特征值进行预测。

需要说明的是,以线性回归算法为基础的模型的一个要点是输入特征x必须是线性的,然后实际情况往往并非如此,所以需要对输入特征进行特征工程处理,例如1/x,x2,lg(x)等,使得转换后的特征值与结果线性相关。其模型构成的信息包括以下:

模型输入:特征向量x;

模型输出:回归值z;

训练得到的回归系数:向量wt

常量项:b;

阶跃函数:none。

实际应用中,如果因变量不是连续的而是分类的,则可以使用logistics链接函数将线性回归转换为逻辑回归,例如,因变量是二分类(0/1,true/false,yes/no)时我们可以使用logistics回归。由于logistics回归是一种分类方法,所以其模型的最终输出必定是离散的分类型,通常是将线性回归后的输出送入一种阶跃函数,再由阶跃函数输出二分类或者多分类值。请参阅图2b,为一种可能的logistics回归的示意图,可将曲线作为边界线,边界线上方的为正例样本,边界线下方的为负例样本。预测模型可以通过如下sigmoid函数表示:

s(x)=1/(1+e-x);

该sigmoid函数的输入记为z,可由以下公式得出:z=wtx+b。

另外,以logistics回归算法为基础的模型,其构成的信息包括:

模型输入:特征向量x指示;

模型输出:分类结果z;

训练得到的回归系数:向量wt

常量项:b;

非线性函数:sigmoid,阶跃函数,对数方程等;

阶跃函数值分离区间阈值,例如该阈值可以为0.5,即大于0.5取1,小于0.5取0.当然,也可能是多分类,则会相应有大于一个的阈值取值。

另外,回归算法中还包括其他最小二乘回归(leastsquare)、逐步回归(stepwiseregression)和岭回归(ridgeregression)等回归方法中的至少一项,此处不再一一赘述。

2、决策树

通常决策树的训练依据输入特征数据的信息熵或者基尼系数,进而确定分类特征优先级和分类判断方法,除此之外还需要对决策树进行剪枝优化,来减少模型预测的过拟合和模型的复杂度。决策树主要有两种类型:分类树(输出是样本的类标)和回归树(输出是一个实数),而分类和回归树(classificationandregressiontree,cart)包含了上述两种决策树,如图2c所示,为一种可能的cart的分类示意图,可以看出,cart是一棵二叉树,且每个非叶子节点都有两个节点,所以对于第一棵子树,其叶子节点数比非叶子节点数多1,基于cart算法的模型其构成的信息可以包括:

模型输入:特征向量x;

模型输出:分类结果z;

模型描述:树状分类结构,如{root:{node:{leaf}}},为便于理解,以ue移动过程中基于目标小区的参考信号接收功率(referencesignalreceivingpower,rsrp)和信号噪声比(signalnoiseratio,snr)决定ue是否切换到目标小区为例,可采用{’rsrp>-110’:{0:’no’,1:{’snr>10’:{0:’no’,1:’yes’}}}},即首先判断rsrp是否大于-110dbm,若判决为0(即不大于-110dbm),则不切换到目标小区(’no’);若判决为1(即大于-110dbm),则进一步判断snr是否大于10db,若判决为0(即小于10db),则不切换到目标小区(’no’),若判决为1(即大于10db),则切换到目标小区(’yes’)。

另外,决策树中还可以包括随机森林,其是由多分类器和回归树棵cart构成,如图2d所示,为一种可能的随机森林和决策树示意图,其利用多棵树对样本进行训练并预测的一种分类器,且树与树之间又是不关联的。训练时,对于每棵树,它们使用的训练集是从总的训练集中有放回采样出来的,训练集中的有些样本可能多次出现在一棵树的训练集中,也可能从未出现在一棵树的训练集中。在训练每一棵树的节点时,选用的特征是从所有特征中随机选择的,每一棵数在样本和特征选择上的随机性有一定的独立性,可以有效解决单棵决策树存在过拟合问题。

预测的过程是同时使用森林里的多棵树分别单独预测,每一颗树都会产生相对应的分类值,再由多棵树的分类结果共同进行决策得到最后的分类结果。决策树的数学模型可以表述为:对于模型的描述可以总结为三个部分:多棵决策树以及相应的特征和方法,可能的分类结果描述,最终的分类选择方法。其构成的信息可以包括:

模型输入:特征向量x;

模型输出:分类结果z;

模型描述:若干棵决策树,即包括若干个上述的决策树的模型,此处不再赘述。

投票方法:包括绝对多数和相对多数,其中绝对多数是某一个预测结果值超过半数(即0.5)或者其他数值的投票结果,比如一个随机森林模型由五棵树构成,分别预测的结果是1,1,1,3,2,那么预测结果就是1;而相对多数即少数服从多数,比如一个随机森林模型由三棵树构成,分别预测的结果是1,2,2,那么预测结果即为2。

3、svm

svm是在分类与回归分析中分析数据的有监督学习模型与相关的学习算法,当样本无法通过线性模型进行线性划分(linearlyseparable)时,需要寻找一个空间的超平面将不同类别的样本分开,如图2e所示,为一种可能的svm分类示意图,另外,svm还要求对样本的局部扰动容忍性高,通过下面的线性方程可以表述所谓的超平面:wtx+b=0,其中,wt为回归系数,b为常量。svm对样本的一个关键操作是隐含着将低维的特征数据映射到高维的特征空间中,而这个映射可以把低维空间中线性不可分的两类点变成线性可分的,这个过程的方法称为核技巧(kerneltrick),所使用的空间映射函数称为核函数(kernelfunction)。核函数不仅适合在支持向量机中使用,以常用的径向基核函数也称高斯核函数为例:

其中x为空间中任一点,y为核函数中心,σ为核函数的宽度参数。除了高斯核之外还有线性核、多项式核、拉普拉斯核、sigmod核函数等,此处不做限定。

其中,在超平面wtx+b=-1和wtx+b=1的两个超平面上面的点的拉格朗日乘子alpha值大于0,其他所有的值的alpha值均为0,所以只需要找到这些落在两侧超平面上的点,并计算出他们的alpha值就可以对新的样本进行分类。由此svm的一个很明显的好处是只需要少量的数据即可以准确的预测,找到全局最优解。构成基于svm算法的模型的信息可以包括:

模型输入:特征向量x;

训练出来的支持向量:svs(x);

训练出来的支持向量所对应的拉格朗日系数:αs;

支持向量所对应的标签值:svlabel(y);

核函数方法:k,例如,所谓径向基函数(radialbasisfunction,rbf);

核函数参数:例如,多项式参数,高斯核带宽等,需要和核函数方法匹配。

常量项:b;

预测值的分类方法:例如sign方法。

4、贝叶斯分类器

贝叶斯分类器是一种概率模型,如图2f所示,为一种可能的贝叶斯分类示意图,其中,class1和class2可以理解为两个分类,例如一个报文是否属于某类业务,即分类为:是和否。其理论基础是贝叶斯决策论,是概率框架下的实施决策的基本方法,概率推断的基础是贝叶斯定理:其中,p(a|b)为后验概率;p(b|a)为在模式属于a类的条件下出现b的概率,称为b的类条件概率密度;p(a)为在所研究的识别问题中出现a类的概率,也成先验概率;p(b)是特征向量b的概率密度。

其应用在机器学习算法中需要将算法设计的模型特征类型代入:

对于所有类别y来讲p(x)都是相同的,根据马尔科夫模型上述贝叶斯公式可近似等于

由此可以比较容易的得出根据输入特征向量预测出分类的模型构成的信息包括:输入层特征及特征方法、p(y)分类类型先验概率列表和p(xi|y)特征值极大似然估计列表。

5、神经网络

如图2g所示,为一种可能的神经网络模型结构示意图,其中,一个完整的神经网络模型包括输入层(inputlayer)、输出层(outputlayer)和一个或多个隐藏层(hiddenlayers),可以认为神经网络模型是多层的二分类感知器,而一个单层的二分类感知器模型又类似于一个回归的模型。输入层的单元是隐藏层单元的输入,隐藏层单元的输出是输出层单元的输入。两个感知器之间的连接有一个权量,第t层的每个感知器与第t-1层的每个感知器相互关联。当然,,也可以设置权量为0,从而在实质上取消连接。

其中,分类评价模型logit有多种方法,例如sigmoid、softplus和relu等,同一个神经网络层可以是基于不同的评价模型方法进行激活分类。最常见的神经网络训练过程可以是由结果向输入倒推,逐步减少误差并调节神经元权重,即误差逆传播(errorbackpropagation,bp)算法。bp的原理可理解为:利用输出后的误差来估计输出层前一层的误差,再用这层误差来估计更前一层误差,如此获取所有各层误差估计。这里的误差估计可以理解为某种偏导数,就是根据这种偏导数来调整各层的连接权值,再用调整后的连接权值重新计算输出误差。直到输出的误差达到符合的要求或者迭代次数溢出设定值。

结合图2g,假设该网络结构是一个含有i个神经元的输入层,含有j个神经元的隐藏层,含有k个神经元的输出层,则输入层网元xi通过隐藏层网元作用于输出层网元,经过非线形变换,产生输出信号zk,其中用于网络训练的每个样本包括输入向量x和期望输出量t,网络输出值y与期望输出值t之间的偏差,通过调整输入层网元与隐藏层网元的连接权量wij和隐藏层网元与输出层网元之间的连接权量tjk以及神经单元阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数(权值和阈值),训练即告停止。此时经过训练的神经网络即能对类似样本的输入信息,自行处理输出误差最小的经过非线形转换的信息。

故基于神经网络的模型的构成信息包括:j

输入层:特征向量x={x1,x2,x3,…,xi};

输出层网元输出算法:如zk=f(∑tjk*yj-θk),其中f为非线性函数,tjk表示隐藏层网元与输出层网元之间的连接权量,yi为隐藏层输出,θk为输出层的神经单元阈值;

隐藏层网元输出算法:如yj=f(∑wij*xi-θi),其中f为非线性函数,wij表示输入层网元i与隐藏层网元j之间的连接权量,xi为输入层输出,θj为隐藏层的神经单元阈值;

输出和隐藏层的每一个网元所对应的权重列表;

每一层所使用的激活函数:如sigmod函数;

误差计算函数:用于反映神经网络期望输出与计算输出之间误差大小的函数,如:

ep=1/(2*∑(tpi-opi)2),其中,tpi表示网元i的期望输出值,opi表示网元i的计算输出值。

以上是对常见的机器学习算法模型的分析和结构分解,依据这些模型可以进一步的进行抽象合并。在现有的3gpp智能网络架构中,将机器学习中的训练和预测都融合在一个网元如nwda中执行,在后续的预测过程中,每一次预测nwda都会接受upf发送的预测所需的数据或者特征向量,由nwda预测出结果并生成策略,而这个过程中产生的交互时延不适合实时性要求很高的特性,影响了其业务体验。有鉴于此,本申请提供了一种基于机器学习的数据处理方法,通过将机器学习中的训练步骤由第二网元执行,第一网元安装算法模型,且该第一网元具备获取特征值的能力,故第一网元可以根据该算法模型对预测所需的数据进行预测,实现了将网络架构内模型和预测的逻辑功能分离,减少了交互时延,解决了现有技术中由于交互时延增加所导致业务体验受到影响的问题。

如图2h所示,为本申请提供的一种可能的系统架构图。在该图中,可以将机器学习的过程在逻辑功能上进一步的分解为数据服务功能(datasevercefunction,dsf),分析和建模功能(analysisandmodelingfunction,a&mf),模型执行功能(modelexecutionfunction,mef)和策略适配功能(adaptedpolicyfunction,apf),需要说明的是,这些功能的命名也可以采用其他命名方式,此处不做限定。图2h中,可以按需将这些功能部署在网络的各层网元上,如5g网络中的集中式单元(centralizedunit,cu),分布式单元(distributedunit,du)以及gnbda内运行,或者部署在lteenodeb,umtsrnc或者nodeb;也可以将上述功能独立部署在一个网元实体,可将该网元实体称为ran数据分析网元(randataanalysis,randa),或者其他命名。

因此在本申请所提供的基于机器学习的数据处理方法中,将机器学习中的训练和预测分别由不同的网元执行,可基于以下两种情况进行分别描述:

情况a、将上述四种功能中除a&mf以外的功能(即dsf、mef和apf)部署在一个独立的网络实体中。

情况b、将上述四种功能(即dsf、a&mf、mef和apf)抽象分解,分开部署在网络的各层网元上。

请参阅图3,为本申请实施例在情况a的基础上所提供的一种可能的基于机器学习的数据处理方法,包括:

301、第二网元获得训练完成的算法模型。

为便于区分,本实施例中将执行预测功能的网元称为第一网元,将执行训练功能的网元称为第二网元。第二网元基于实际智能业务的需求,选择合适的算法、特征以及标签数据,来训练算法模型。第二网元通过要实现的目标,并以此来找到合适的算法。例如,若要实现的目标是预测目标变量的值,则可以选择监督学习算法。在选择监督学习算法后,若目标变量的类型是离散型,如是/否,1/2/3等,则可以进一步选择监督学习算法中的分类器算法;若目标变量类型是连续型的数值,则可以选择监督学习算法中的回归算法。特征选择是一个从原始特征集合中选择最优子集的过程,在该过程中,对一个给定特征子集的优良性通过一个特定的评价标准(evaluationcriterion)进行衡量,通过特征选择,将原始特征集合中的冗余(redundant)特征和不相关(irrelevant)特征除去,而保留有用特征。

需要说明的是,在接入网中,第二网元可以是randa,或者部署在cu的cuda(可理解为randa部署在cu上的名称)或者部署在运营支撑系统(operationsupportsystem,oss)的ossda(可理解为randa部署在oss上的名称),或者部署在du的duda(可理解为randa部署在du上的名称),或者部署在gnb的gnbda(可理解为randa部署在gnb上的名称)。在核心网中,第二网元可以是nwda,作为一个独立部署的网元。第一网元可以是基站或upf。例如在核心网中,第一网元可以为upf;在接入网中,第一网元可以为基站,故此处不做限定。

另外,基于前述提到的各种算法,第二网元选择的合适的算法,并依据实际业务需求选择合适的特征以及标签。将选择的特征和标签,以及准备好的训练数据输入到算法后执行训练,来得到训练完成的算法模型。为便于理解训练的流程,以神经网络算法为例来说明模型训练的大概过程:由于神经网络被用于监督学习的任务中,即有大量的训练数据用来进行模型的训练。因此,在针对神经网络算法模型的训练之前,将选择的标签数据作为训练数据。

获得训练数据后,基于该训练数据对神经网络算法模型进行训练,其中神经网络算法模型可以包括生成器和判别器。实际应用中,可以采用对抗性训练的思想,来交替训练生成器和判别器,进而将待预测数据输入至最终得到的生成器,以生成对应的输出结果。例如,生成器是一个概率生成模型,其目标为生成与训练数据分布一致的样本。判别器则是一个分类器,其目标为准确判别一个样本是来自训练数据、还是来自生成器。这样一来,生成器和判别器形成“对抗”,生成器不断优化使得判别器无法区分出生成样本和训练数据样本的区别,而判别器不断优化使得能够分辨这种区别。生成器和判别器交替训练,最终达到平衡:生成器能生成完全符合训练数据分布的样本(以至判别器无法分辨),而判别器则能够敏感的分辨任何不符合训练数据分布的样本。

判别器根据训练数据样本和生成样本对生成器进行模型训练,通过训练后的判别器的模型对生成器所生成的每个生成样本的归属率进行判别,并将判别结果发送给生成器,以使得生成器根据判别器所判别的新的生成样本和判别结果进行模型训练。依此进行循环的对抗性训练,从而提高生成器生成该生成样本的能力,提高判别器判别生成样本归属率的能力。即,对抗性训练中,会交替训练判别器和生成器,直至达到平衡。当生成器的能力和判别器的能力训练到一定程度后,判别器判别生成器所生成的样本的归属率将趋向稳定。此时,则可以停止训练生成器和判别器的模型。例如当判别器根据所获取的所有训练数据样本和生成样本进行样本的归属率的判别,且判别器得到的判别结果的变化量小于预设阈值时,则可以结束对神经网络算法模型的训练。

可选的,还可以通过生成器和判别器的迭代次数作为判断条件来确定是否停止训练,其中生成器生成一次生成样本以及判断器判断一次生成器生成的生成样本表示一次迭代。比如,设置1000次迭代指标,若生成器生成过1000次后,则可以停止训练,或者若判别器判断过1000次后,则可以停止训练,进而得到训练好的神经网络算法模型。

需要说明的是,随着人工智能的不断发展和更新,关于算法模型的训练已经是较为成熟的技术,关于其他算法如回归算法或者决策树等所对应的模型的训练,此处不再一一赘述。

302、第二网元向第一网元发送算法模型的安装信息。

第二网元训练得到算法模型后,通过与第一网元之间的通信接口向第一网元发送算法模型的安装信息。该算法模型的安装信息可以携带于第一消息中来发送给第一网元。其中,该算法模型的安装信息包括:算法模型的唯一标识id、算法模型的算法类型指示(例如指示该算法模型的算法类型为线性回归或者是神经网络)、算法模型的结构参数(例如线性回归模型的结构参数可包括回归值z、回归系数、常量项和阶跃函数等)、算法模型的安装指示(用于指示第一网元安装该算法模型)。需要说明的是,由于各算法模型的算法类型所对应的结构参数各不一样,实际应用中,算法模型的安装信息中还可以不包括算法模型的算法类型指示,即第一网元可通过算法模型的结构参数确定算法模型的算法类型,故算法模型的算法类型指示可以为可选项,此处不做限定。

可选的,该算法模型的安装信息中还可包括策略索引信息,其中策略索引信息包括该算法模型的各预测结果,和与各预测结果对应的策略的标识信息(例如预测结果1对应的策略的标识信息为id1,id1对应的策略是设置qos参数值。

需要说明的是,第二网元还可通过该第一消息向第一网元发送采集信息,以使得第一网元根据该采集信息订阅特征向量来作为算法模型的输入。其中特征向量的采集信息至少包括待采集特征的标识id。特征向量为待采集特征的特征值集合。为便于理解特征、特征值和特征向量的关系,将进行举例说明,例如对一个报文,待采集特征为ip地址、appid和端口号,则对应的特征值可以为10.10.10.0、wechat和21,特征向量即为特征值的集合{10.10.10.0,wechat,21}。可选的,该特征向量的采集信息中还可以包括特征向量的订阅周期,如每3分钟采集一次特征向量,即第一网元的运行参数可能一直在发生变化,每隔一个订阅周期就采集不同的数据的特征向量来作为算法模型的输入进行预测。

可选的,第二网元除了通过上述第一消息来将该采集信息发送给第一网元,还可以向第一网元发送第二消息,该第二消息携带采集信息,另外,为了使第一网元明确所订阅的特征向量是服务于哪个算法模型的,第二消息还携带有该算法模型的唯一标识id。综上,采集信息和算法模型的安装信息可以同时包含在一个消息中发送给第一网元,也可以分解为两条消息分别发送给第一网元。需要说明的是,若分解为两条消息分别发送给第一网元,则第二网元发送该两条消息的时序可以为先发第一消息,再发第二消息,或者同时发送,此处不做限定。

需要说明的是,实际应用中,该第一消息可以为模型安装消息(modelinstallmessage),或者其他已有的消息,此处不做限定。

303、第一网元根据算法模型的安装信息安装算法模型。

第一网元通过与第二网元之间的通信接口接收到第一消息后,获取到第一消息中包含的算法模型的安装信息,进而根据该算法模型的安装信息安装算法模型,安装过程可以包括:第一网元确定算法模型的算法类型,确定的方式可以为通过第一消息中的算法类型指示来直接确定算法模型的算法类型,或者当第一消息中不包含算法类型指示时,通过第一消息中的算法模型的结构参数对应确定算法模型的算法类型。例如,若算法模型的结构参数包括特征向量x、分类结果z、训练得到的回归系数wt、常量项b,以及阶跃函数和解约函数值分离区间阈值0.5,则第一网元可以确定该算法模型的算法类型为logistics回归。在确定了算法模型的算法类型后,将算法模型的结构参数作为算法模型的算法类型所对应的模型构成参数,以完成算法模型的安装。为便于理解,以算法类型为线性回归算法为例进行说明,若第一消息中的算法类型指示用于指示该算法模型的结构类型为线性回归算法,且算法模型的结构参数包括特征集(即特征的集合)和对应的回归系数wt、常量项b,则第一网元将该算法模型的结构参数作为模型构成参数实例化到对应的算法模型的结构中。例如一个用来控制导频功率的线性回归模型的特征集包括{rsrp,cqi,tcpload},回归系数分别是{0.45,0.4,0.15},常量项b是60,没有阶跃函数(因为是线性回归不是逻辑回归),第一网元接收到上述的模型结构参数后即可在本地实例化模型。

可选的,当算法模型的安装信息和采集信息同时包含在一个消息中,即当第一消息中还包括采集信息时,第一网元需要根据该采集信息订阅特征向量,订阅特征向量的过程可以包括:第一网元根据该采集信息判断自身是否具备提供待采集特征的特征值的能力。其中,第一网元判断自身是否具备该能力的方式有多种,例如,第一网元确定待采集特征的标识id是否包含于预置的可采集特征信息中,若包含,则第一网元确定具备该能力;反之,若不包含,则第一网元确定不具备该能力。可以理解为,第一网元支持提供特征值的每一个特征都有一个唯一的编号,比如编号1a对应rsrp,编号2a对应信道质量指示(channelqualityindicator,cqi),编号3a对应信号与干扰加噪声比(signaltointerferenceplusnoiseratio,sinr)等,可将这些编号作为预置的可采集特征信息,如果待采集特征对应的编号不在其中,那就是不支持提供该待采集特征的特征值。因此,若第一网元判断自身具备提供待采集特征的特征值的能力,则第一网元成功订阅特征向量;对应的,若第一网元判断其不具备提供待采集特征的特征值的能力,则第一网元订阅特征向量失败。需要说明的是,若第一网元订阅特征向量失败,则第一网元还需向第二网元反馈订阅失败消息,该订阅失败消息需携带不能获取到的特征的标识信息。

可选的,当算法模型的安装信息和采集信息不在一个消息内,即第一网元还从第二网元接收第二消息,获取到第二消息中包含的采集信息时,第一网元可根据该第二消息中的采集信息来订阅特征向量,订阅特征向量的过程此处不再赘述。

304、第一网元向第二网元发送安装结果指示。

可选的,响应于第一消息,第一网元通过与第二网元的通信接口向第二网元发送第一响应消息,该第一响应消息携带有安装结果指示,且第一响应消息中包括该算法模型的唯一标识id。例如,第一网元安装算法模型成功时,该安装结果指示用于向第二网元指示安装该算法模型成功;第一网元安装算法模型失败时,该安装结果指示用于向第二网元指示安装该算法模型失败。此时,可选的,第一响应消息还携带有安装失败原因指示,用于告知第二网元安装失败的原因。其中,安装失败的原因可以为算法模型过大,或者是算法模型的安装信息中的参数不合法等,此处不做限定。

可选的,若第一网元还从第二网元接收采集信息以订阅特征向量,则第一网元可向第二网元发送特征向量订阅结果指示,用于指示该特征向量是否订阅成功。需要说明的是,若算法模型的安装信息和采集信息均携带于第一消息中,则对应的第一响应消息中也携带有特征向量订阅结果指示。可选的,若特征向量订阅结果指示用于指示特征向量订阅失败,该第一响应消息还携带有不能获取到的特征的标识信息。

可选的,若第二网元通过第二消息将采集信息发送给第一网元时,则响应于该第二消息,第一网元通过与第二网元的通信接口向第二网元发送第二响应消息,该第二响应消息中携带有特征向量订阅结果指示。可选的,若特征向量订阅结果指示用于指示特征向量订阅失败,该第二响应消息还携带有不能获取到的特征的标识信息。

需要说明的是,实际应用中,该第一响应消息可以为模型安装响应(modelinstallresponse)消息,或者其他已有的消息,此处不做限定。

305、第一网元根据算法模型对数据进行预测。

第一网元订阅好特征向量且成功安装算法模型后,开始执行预测功能,即根据安装好的算法模型对数据进行预测,包括:第一网元采集数据,实际应用中,第一网元采集的数据可以为但不限于以下几种中的任一项:1、第一网元运行状态的参数,如中央处理器(centralprocessingunit,cpu)占用率、内存使用率、发包速率等;2、经过第一网元的报文特征数据,如包大小,包间隔等;3、基站rrm/rrt相关的参数,如rsrp,cqi等。第一网元采集的数据此处不做限定。

第一网元采集到数据后,通过采集信息中待采集特征的标识id获取该数据的目标特征向量,第一网元将该目标特征向量输入到算法模型中得到目标预测结果,需要说明的是,该目标预测结果可以为一个数值或者一个分类。第一网元得到目标预测结果后,在策略索引信息中找出与目标预测结果对应的目标策略的标识信息,进而第一网元可以根据该目标策略的标识信息索引到目标策略,并对第一网元采集到的数据执行该目标策略。

需要说明的是,实际应用中,在安装完算法模型后,第一网元还可以根据实际需求对该算法模型执行其他操作,例如删除或者修改等。例如,第一网元对安装完成的算法模型执行其他操作可以包括:第一网元通过与第二网元的通信接口从第二网元接收第三消息,该第三消息至少携带有算法模型的唯一标识id,且该第三消息用于指示第一网元对算法模型执行目标操作。目标操作可以包括以下操作中的一种:修改算法模型(modelmodification)、删除算法模型(modeldelete)、激活算法模型(modelactive)或者去激活算法模型(modelde-active)。需要说明的是,针对不同的操作,第三消息中携带的信息也可能不同,例如,当目标操作为删除、激活或者去激活算法模型时,第三消息中可以携带该算法模型的唯一标识id;当目标操作为修改算法模型时,第三消息中还要包括修改后的算法模型的安装信息,以使得第一网元能依据该修改后的算法模型的安装信息对算法模型进行修改。

本申请实施例中,将机器学习中的训练步骤由第二网元执行,第一网元安装算法模型,并根据该算法模型对第一网元采集到的数据进行预测,实现了将网络架构内模型和预测的逻辑功能分离,在第一网元获取到特征的特征值以得到特征向量后,即可根据已安装的算法模型进行预测,减少了交互时延,解决了现有技术中由于交互时延增加所导致业务体验受到影响的问题。

需要说明的是,基于对智能网元功能的分解,将机器学习的过程在逻辑功能类别上抽象出dsf、a&mf、mef和apf功能,每一个分布式单元都可以部署这四类逻辑功能,并执行其中的一个或多个功能,为便于理解,本实施例中,将执行a&mf功能的网元称为第二网元,执行mef的网元称为第一网元,执行dsf的网元称为第三网元,执行apf的网元称为第四网元,基于此,请参阅图4,为本申请实施例在情况b的基础上所提供的一种可能的基于机器学习的数据处理方法,包括:

401、第二网元获得训练完成的目标算法模型。

402、第二网元向第一网元发送目标算法模型的安装信息。

403、第一网元根据目标算法模型的安装信息安装目标算法模型。

本申请实施例中,步骤401至步骤403与图3中的步骤301至303类似,此处不再赘述。

404、第一网元向第三网元发送采集信息。

在步骤402中,第二网元可以通过第一消息来携带采集信息并发送给第一网元,或者第二网元向第一网元发送第二消息,该第二消息中携带有该采集信息和目标算法模型的唯一标识id。

因此,当采集信息携带于第一消息时,第一网元接收并解码该第一消息,将其中的采集信息独立出并携带于单独的第三消息(例如特征订阅消息(featuresubscribemessage)或者其他已有消息)中,第一网元将该第三消息通过与第三网元之间的通信接口发送给第三网元,以使得第三网元根据第三消息所包含的采集信息,获取到第一网元采集到的数据的目标特征向量。由于实际应用中,算法模型可能包括多个模型,因此第三网元可能需要为多个模型提供模型输入的特征向量,为便于第三网元明确所订阅的特征向量是服务于哪一个算法模型,本申请中将算法模型中的至少一个模型称为目标算法模型,故该第三消息中还包括目标算法模型的唯一标识id。

可选的,当采集信息携带于第二消息时,则第一网元可将接收到的第二消息通过与第三网元之间的通信接口转发给第三网元。

可选的,第二网元还可以直接向第三网元发送采集信息,例如,第二网元向第三网元发送第四消息,该第四消息中携带有采集信息和目标算法模型的唯一标识id,故第三网元接收到特征向量的采集信息的方式此处不做限定。

405、第三网元向第一网元发送特征向量订阅结果指示。

第三网元获得采集信息以订阅特征向量后,判断自身是否具备提供待采集特征的特征值的能力,需要说明的是,本实施例中,第三网元判断自身是否具备提供待采集特征的特征值的能力的方式与图3中的步骤303中所述的第一网元判断自身是否具备提供待采集特征的特征值的能力的方式类似,此处不再赘述。

可选的,第三网元向第一网元发送特征向量订阅结果指示,用于向第一网元指示特征向量订阅是否成功。需要说明的是,若采集信息为第一网元通过第三消息携带来发送给第三网元,则对应的,第三网元可以通过第三响应消息将特征向量订阅结果指示发送给第一网元,且该第三响应消息还携带有目标算法模型的唯一标识id。可选的,若第三网元判断自身不具备提供待采集特征的特征值的能力,即特征向量订阅结果指示用于指示特征向量订阅失败,则第三响应消息中还携带有不能获取到的特征的标识信息。

可选的,若第三网元获得的采集信息为第二网元直接通过第四消息携带来向第三网元发送,则第三网元向第二网元发送第四响应消息,该第四响应消息携带特征向量订阅结果指示;可选的,当特征向量订阅结果指示用于指示特征向量订阅失败时,第四响应消息中还携带有不能获取到的特征的标识信息。

406、第一网元向第二网元发送安装结果指示。

本申请实施例中,步骤406与图3中的步骤304类似,此处不再赘述。

407、第三网元向第一网元发送目标特征向量。

当特征向量订阅结果指示用于指示特征向量订阅成功时,第三网元从第一网元中采集目标数据,并获得该目标数据的待采集特征的特征值,进而得到目标特征向量。故第三网元获得目标特征向量后,可以通过特征向量反馈消息向第一网元发送目标特征向量,该特征向量反馈消息可以为特征反馈(featurereport)消息或者其他已有消息,且该特征向量反馈消息还携带有目标算法模型的唯一标识id。

可选的,若该特征向量的订阅为周期性订阅时,则第三网元每隔一个订阅周期即向第一网元发送特征向量反馈消息。

408、第一网元根据目标算法模型进行预测。

第一网元接收到特征向量反馈消息后,根据特征向量反馈消息中的目标算法模型的标识id索引到用于执行预测的目标算法模型,并将特征向量反馈消息中的目标特征向量输入到该目标算法模型中,以得到对应的目标预测结果。需要说明的是,该目标预测结果可以为一个数值,例如为连续区间内的数值或者离散区间内的数值。

409、第一网元向第四网元发送目标预测结果。

第一网元产生目标预测结果后,通过与第四网元之间的通信接口向第四网元发送该目标预测结果,其中,该目标预测结果可携带于第一网元向第四网元发送的第五消息中,其中该第五消息可以为预测指示消息(predicationindicationmessage)或者其他已有消息,此处不做限定。

需要说明的是,该第五消息除了携带目标预测结果外,还可携带目标算法模型的唯一标识id、和与该目标算法模型对应的目标策略索引信息,以使得所述第四网元根据该第五消息确定与目标预测结果对应的目标策略。

410、第四网元确定目标策略;

第四网元通过与第一网元之间的通信接口接收到第五消息后,进行解码获得第五消息携带的目标算法模型的唯一标识id、目标预测结果、和与该目标算法模型对应的目标策略索引信息,进而在目标策略索引信息中找出与目标策略结果对应的目标策略的标识信息,即第四网元确定得到目标策略。

可选的,第四网元还可以判断该目标策略是否适配于对应预测的数据,例如实际应用中,在切换基站时,不仅需要依据模型预测的结果,还要结合网络实际的运行状态如是否发生拥塞等情况,若不适配,则需要重新确定目标策略。

可选的,第四网元确定目标策略后,向第一网元发送第五反馈消息,该第五反馈消息可以为预测响应(predicationresponse)消息或者其他已有消息,该第五反馈消息用于向第一网元反馈目标预测结果对应的目标策略,该第五反馈消息携带有目标策略的标识信息,以使得第一网元能对目标数据执行该目标策略。

本申请实施例中,将逻辑功能分离为四种,可以按需部署在不同的实体设备上,增加了网络的灵活性,另外不需要的功能也可以不部署,节约了网络资源。

上面对本申请实施例中基于机器学习的数据处理方法进行了描述,下面对本申请实施例中的网元进行描述,请参阅图5,本申请实施例中网元的一个实施例,该网元可以执行上述方法实施例中的第一网元的操作,该网元包括:

第一收发单元501,用于从第二网元接收算法模型的安装信息,该第二网元用于训练该算法模型;

安装单元502,用于根据该收发单元接收的算法模型的安装信息,安装算法模型;

采集单元503,用于采集数据;

预测单元504,用于当安装单元安装算法模型成功后,根据算法模型对采集单元504采集到的数据进行预测。

可选的,在一些可能的实现方式中,

第一收发单元501还用于从第二网元接收采集信息,采集信息至少包括待采集特征的标识id。

可选的,在一些可能的实现方式中,该第一网元可进一步包括:

第二收发单元505,用于向第三网元发送采集信息和目标算法模型的唯一标识id,目标算法模型为算法模型中的至少一个模型;从第三网元接收与采集信息对应的目标特征向量和目标算法模型的唯一标识id,目标算法模型用于执行预测操作。

可选的,在一些可能的实现方式中,该第一网元可进一步包括:

第三收发单元506,用于向第四网元发送目标算法模型的唯一标识id,目标预测结果和与目标算法模型对应的目标策略索引信息,目标预测结果用于目标策略的确定,目标预测结果为将目标特征向量输入至目标算法模型所得到的结果;从第四网元接收目标策略的标识信息。

可选的,在一些可能的实现方式中,第一收发单元501还可用于:

从第二网元接收目标操作指示和算法模型的唯一标识id,目标操作指示用于指示第一网元对算法模型执行目标操作,目标操作包括修改所述算法模型,删除算法模型,激活算法模型或者去激活算法模型。

可选的,第一收发单元501还可用于:

当目标操作为修改算法模型时,从第二网元接收修改后的算法模型的安装信息。

可选的,第一收发单元501还可用于:

当算法模型安装失败后,向第二网元发送安装失败原因指示。

本申请实施例中,将机器学习中的训练步骤由第二网元执行,安装单元安装算法模型,并由预测单元根据该算法模型对第一网元接收到的数据进行预测,实现了将网络架构内模型和预测的逻辑功能分离,在采集单元采集到数据后,预测单元即可根据已安装的算法模型对数据进行预测,减少了交互时延,解决了现有技术中由于交互时延增加所导致业务体验受到影响的问题;另外,还可将逻辑功能分离为四种,可以按需部署在不同的实体设备上,增加了网络的灵活性,另外不需要的功能也可以不部署,节约了网络资源。

请参阅图6,本申请实施例中网元的另一个实施例,该网元可以执行以上方法实施例中的第二网元的操作,该网元包括:

训练单元601,用于获得训练完成的算法模型;

收发单元602,用于向第一网元发送算法模型的安装信息,算法模型的安装信息用于算法模型的安装,算法模型用于数据预测,第一网元为upf或基站。

可选的,在一些可能的实现方式中,收发单元602还用于,当第一网元安装算法模型失败时,从第一网元接收安装失败原因指示。

可选的,在一些可能的实现方式中,收发单元602还用于:

向第一网元发送采集信息,采集信息至少包括待采集特征的标识id。

本申请实施例中,将机器学习中的训练步骤由第二网元的训练单元执行,第一网元安装算法模型,并根据该算法模型对第一网元采集到的数据进行预测,实现了将网络架构内模型训练和预测的逻辑功能分离,在第一网元采集到数据后,即可根据已安装的算法模型对数据进行预测,减少了交互时延,解决了现有技术中由于交互时延增加所导致业务体验受到影响的问题;另外,还可将逻辑功能分离为四种,可以按需部署在不同的实体设备上,增加了网络的灵活性,另外不需要的功能也可以不部署,节约了网络资源。

上面图5至图6从模块化功能实体的角度分别对本申请实施例中的第一网元和第二网元进行详细描述,下面从硬件处理的角度对本申请实施例中的第一网元和第二网元进行详细描述。

请参阅图7。在采用集成的单元的情况下,图7示出了一种通信装置可能的结构示意图。该通信装置700包括:处理单元702和通信单元703。处理单元702用于对该通信装置的动作进行控制管理。该通信装置700还可以包括存储单元701,用于存储该通信装置所需的程序代码和数据。

在一个实施例中,该通信装置可以是上述第一网元。例如,处理单元702用于支持第一网元执行图3中的步骤303和步骤305,图4中的步骤403和步骤408,和/或用于本文所描述的技术的其它过程。通信单元703用于支持第一网元与其他设备的通信,例如,通信单元703用于支持第一网元执行图3中的步骤302和步骤304,图4中的步骤402、步骤404至步骤407,和步骤409。

在另一个实施例中,该通信装置可以是上述第二网元。例如,处理单元702用于支持第二网元执行图3中的步骤301,图4中的步骤401,和/或用于本文所描述的技术的其它过程。通信单元703用于支持第二网元与其他设备的通信,例如,通信单元703用于支持第二网元执行图3中的步骤302和步骤304,图4中的步骤402和步骤406。

其中,处理单元702可以是处理器或控制器,例如可以是中央处理器(centralprocessingunit,cpu),通用处理器,数字信号处理器(digitalsignalprocessor,dsp),专用集成电路(application-specificintegratedcircuit,asic),现场可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等等。通信单元703可以是通信接口、收发器、收发电路等,其中,通信接口是统称,可以包括一个或多个接口,例如收发接口。存储单元701可以是存储器。

处理单元702可以为处理器,通信单元703可以为通信接口,存储单元701可以为存储器时,参阅图8所示,该通信装置810包括:处理器812、通信接口813、存储器811。可选的,通信装置810还可以包括总线814。其中,通信接口813、处理器812以及存储器811可以通过总线814相互连接;总线814可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。总线814可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

类似的,在一个实施例中,通信装置810可用于指示上述第一网元的步骤。在另一个实施例中,通信装置810可用于指示上述第二网元的步骤。此处不再赘述。

本申请实施例还提供一种装置,该装置可以是芯片,该装置包括存储器,其中存储器用于存储指令。当存储器存储的指令被处理器执行时,使得处理器执行第一网元在图3至图4所述实施例中的基于机器学习的数据处理方法中的部分或全部步骤,例如图3中的步骤303和步骤305、图4中的步骤403和步骤408,和/或用于本申请所描述的技术的其它过程。或者,使得处理器执行第二网元在图3至图4所述实施例中的基于机器学习的数据处理方法中的部分或全部步骤,例如图3中的步骤301、图4中的步骤401,和/或用于本申请所描述的技术的其它过程。

本申请实施例还提供一种系统,如图9所示,为本申请提供的一种可能的系统的结构示意图,该系统可以包括一个或多个中央处理器922和存储器932,一个或一个以上存储应用程序942或数据944的存储介质930(例如一个或一个以上海量存储设备)。其中,存储器932和存储介质930可以是短暂存储或持久存储。存储在存储介质930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对系统中的一系列指令操作。更进一步地,中央处理器922可以设置为与存储介质930通信,在系统900上执行存储介质930中的一系列指令操作。系统900还可以包括一个或一个以上电源926,一个或一个以上有线或无线网络接口950,一个或一个以上输入输出接口958,和/或,一个或一个以上操作系统941,例如windowsserver,macosx,unix,linux,freebsd等等。

上述图3至图4所描述的基于机器学习的数据处理方法的实施例可以基于该图9所示的系统结构来实现。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程设备。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriberline,dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘(solidstatedisk,ssd))等。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1