数据处理方法、装置、电子设备和计算机可读存储介质与流程

文档序号：40396650发布日期：2024-12-20 12:20阅读：29来源：国知局

本发明涉及计算机，具体涉及一种数据处理方法、装置、电子设备和计算机可读存储介质。

背景技术：

1、在电池大数据聚合分析和模型搭建时，强依赖“电池系统类型”唯一标识信息。在电池系统类型打标过程中，往往采用电池全生命周期均不变的静态信息进行聚类，以根据聚类结果中的类别进行打标。

2、但是，现有的聚类方法中，由于聚类使用的静态信息需要强依赖新能源汽车、两轮车、桩或储能传输至云平台的静态信息质量，在聚合使用时，会存在因个别信息的问题导致错误分类、过多分类、少分类等结果，且对于“新增类型低质量电池信息”和“新增新型电池信息”在归入指定类别和新增分类时存在困难，因此如何搭建一套高泛化性、通用性和适用新增分类的方法，对解决以上问题有重要的价值和意义。

技术实现思路

1、有鉴于此，本发明实施例的目的在于提供一种数据处理方法、装置、电子设备和计算机可读存储介质，以提高标签确定的准确性和泛化性。

2、第一方面，本发明实施例旨在提供一种数据处理方法，所述方法包括：

3、获取电池流数据，所述电池流数据包括多个电池数据组；

4、将各所述电池数据组分别输入预先训练的分类模型中进行分类，确定所述电池数据组的类别标签，所述类别标签为已有标签或新标签；

5、根据所述新标签对应的所述电池数据组生成增量数据集；

6、将所述增量数据集输入预先训练的聚类模型中进行聚类，确定增量聚类结果，所述增量聚类结果包括至少一个聚类新簇，各所述聚类新簇具有对应的簇中心点和新增类别标签；

7、根据增量聚类结果对所述分类模型进行增量学习训练，以基于训练后的分类模型确定类别标签。

8、第二方面，本发明实施例旨在提供一种数据处理装置，所述装置包括：

9、获取单元，用于获取电池流数据，所述电池流数据包括多个电池数据组；

10、分类单元，用于将各所述电池数据组分别输入预先训练的分类模型中进行分类，确定所述电池数据组的类别标签，所述类别标签为已有标签或新标签；以及根据所述新标签对应的所述电池数据组生成增量数据集；

11、聚类单元，用于将所述增量数据集输入预先训练的聚类模型中进行聚类，确定增量聚类结果，所述增量聚类结果包括至少一个新簇，各所述新簇具有对应的簇中心点和第二类别标签；

12、训练单元，用于根据增量聚类结果对所述分类模型进行增量学习训练，以基于训练后的分类模型确定类别标签。

13、第三方面，本发明实施例旨在提供一种计算机程序产品，所述计算机程序产品包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现如上任一项所述的方法。

14、第四方面，本发明实施例旨在提供一种电子设备，包括存储器和处理器，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如上任一项所述的方法。

15、第五方面，本发明实施例旨在提供一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现如上任一项所述的方法。

16、本发明实施例的技术方案通过将电池流数据中的各电池数据组分别输入预先训练的分类模型中进行分类，确定电池数据组的类别标签，根据新标签对应的电池数据组生成增量数据集，并将增量数据集中的电池数据组输入预先训练的聚类模型中进行聚类，确定增量聚类结果；根据增量聚类结果对分类模型进行增量学习训练，以基于训练后的分类模型确定类别标签，不仅能够确定新增类别下的电池数据组的类别标签，提高标签确定的准确性，还能使得电池分类信息能够基于新增电池数据组进行扩展，提高标签确定的泛化性。

技术特征：

1.一种数据处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据增量聚类结果对所述分类模型进行增量学习训练包括：

3.根据权利要求2所述的方法，其特征在于，所述分类模型包括输入层、隐藏层和输出层，所述根据各所述聚类新簇的簇中心点调整所述分类模型的结构包括：

4.根据权利要求2所述的方法，其特征在于，所述根据新类别数据信息对调整后的分类模型进行迭代训练包括：

5.根据权利要求1所述的方法，其特征在于，所述聚类模型基于以下方法确定：

6.根据权利要求5所述的方法，其特征在于，所述分类模型基于以下方法确定：

7.根据权利要求1所述的方法，其特征在于，所述将各所述电池数据组分别输入预先训练的分类模型中进行分类，确定所述电池数据组的类别标签包括：

8.根据权利要求1所述的方法，其特征在于，所述获取电池流数据包括：

9.根据权利要求1所述的方法，其特征在于，所述电池数据组包括电池材料类型、电池额定容量、电池额定总电压、电池最大使用温度、电池单体上限电压、系统最大总电压、电池标称总能量。

10.根据权利要求1所述的方法，其特征在于，所述聚类模型采用dbscan模型，所述分类模型采用径向基神经网络rbfnn模型。

11.一种数据处理装置，其特征在于，所述装置包括：

12.一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现权利要求1-10中任一项所述的方法。

13.一种电子设备，包括存储器和处理器，其特征在于，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现权利要求1-10中任一项所述的方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-10中任一项所述的方法。

技术总结
本发明实施例公开了一种数据处理方法、装置、电子设备和计算机可读存储介质，所述方法包括将电池流数据中的各电池数据组分别输入预先训练的分类模型中进行分类，确定电池数据组的类别标签，根据新标签对应的电池数据组生成增量数据集，并将增量数据集中的电池数据组输入预先训练的聚类模型中进行聚类，确定增量聚类结果；根据增量聚类结果对分类模型进行增量学习训练，以基于训练后的分类模型确定类别标签。由此，本实施例中通过上述方法能够确定新增类别下的电池数据组的类别标签，并使得电池分类信息能够基于新增电池数据组进行扩展，提高标签确定的准确性和泛化性。

技术研发人员：苏朝磊,孙一恒,陈永健,廖兰新
受保护的技术使用者：浙江小桔绿色能源科技有限公司
技术研发日：
技术公布日：2024/12/19

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：苏朝磊,孙一恒,陈永健,廖兰新
技术所有人：浙江小桔绿色能源科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。