一种水务大数据挖掘建模管理方法、装置、设备和介质与流程

文档序号:20997859发布日期:2020-06-05 22:22阅读:410来源:国知局
一种水务大数据挖掘建模管理方法、装置、设备和介质与流程

本发明涉及水务数据处理领域,特别涉及一种水务大数据挖掘建模管理方法、装置、设备和介质。



背景技术:

随着智能水表及智能监测设备的部署投入,带来海量的水务数据沉淀,水务大数据的数据价值挖掘与应用是当前水务行业的重点发力点,需要通过机器学习算法开展水务数据挖掘建模,实现短、频、快的应用轻量级模型的实施,能够支撑多类型多迭代的数据挖掘模型并发重建,通过实时更新与迭代优化保障水务数据模型常态化运行。

而现有的水务数据分析与挖掘,主要依靠开发人员实现数据挖掘算法、构造数据处理流程并部署数据处理应用,给排水业务专家因it技术门槛性要求难以参与到水务建模中,业务与技术无法充分配合,带来极大的水务数据挖掘模型的应用难度和复杂度,主要体现在:1、水务数据挖掘技术门槛高,一个数据挖掘模型的建立与应用需要高级数据分析专家花费好几周甚至好几个月时间,而且因每个水务企业的业务场景有所差异,数据模型无法直接复用;2、模型动态更新要求高,在实时供水监测层面上,需要能够根据监测数据进行实时动态仿真与优化调整,而不是离线批量定期执行,模型迭代上需要能够更加的智能化,而不是手工迭代;3、水务业务人员的参与层度低,管网平差、水力模型计算等水务特有的业务算法,难与数据挖掘算法相结合,水务给排水业务专家业务知识无法顺利灌输到数据挖掘建模中,特征工程开展难度大,存在业务与技术的严重割裂。



技术实现要素:

本发明要解决的技术问题,在于提供一种水务大数据挖掘建模管理方法、装置、设备和介质,解决现有水务数据分析与挖掘主要依靠开发人员来实现,而给排水业务专家因it技术门槛性要求难以参与到水务建模中,导致业务与技术无法充分配合,并带来极大的水务数据挖掘模型的应用难度和复杂度的问题。

第一方面,本发明提供了一种水务大数据挖掘建模管理方法,所述方法包括:

将第三方模型的水务数据建模结果通过标准化的pmml文件接入到模型解析转换服务,并由模型解析转换服务对模型的pmml文件进行解析,以获取模型的相关信息;

将模型的pmml文件发布到平台系统上,并对模型进行上线登记、下线登记以及归档管理;

调用场景应用元素库对模型运行所使用到的业务数据进行场景元素分解和解析,输出业务原子元素清单,并将业务原子元素清单进一步解析形成数据对接接口列表;

业务系统基于即将调用的数据挖掘计算需求,根据数据对接接口列表完成业务调用配置,以实现通过水务数据挖掘数据库提供对应的建模标签数据及数据样本,通过水务数据算法封装库提供具体执行的机器学习算法,通过数据挖掘计算引擎提供接口服务;

结合数据挖掘计算引擎、水务数据算法封装库和水务挖掘数据库,对上线的模型进行业务应用效果评估反馈、业务元素质量评估、算法效率综合评估以及模型应用评估分析;

对模型进行优化迭代配置,所述优化迭代配置至少包括迭代配置定义、迭代执行以及迭代反馈三个环节,并根据优化迭代配置对模型进行迭代。

进一步的,所述方法还包括:

通过模型解析转换服务对平台模型结果进行pmml文件构造,将模型参数通过标准化的pmml文件进行输出,并提供模型输入变量的口径以及接口定义文件。

进一步的,所述的将第三方模型的水务数据建模结果通过标准化的pmml文件接入到模型解析转换服务,并由模型解析转换服务对模型的pmml文件进行解析具体为:将第三方模型的模型数据通过数据同步需求开发接入到模型解析转换服务,将第三方模型的模型参数通过标准化的pmml文件交付给模型解析转换服务;模型解析转换服务对交付的pmml文件内容进行解析,在解析获取模型的相关信息后,对应的模型预测算法将被表达为数据库所能支持的sql语句;其中,所述pmml文件中至少包括模型输入变量的口径、接口定义、参数说明以及业务元素说明;

所述的调用场景应用元素库对模型运行所使用到的业务数据进行场景元素分解和解析具体为:所述场景应用元素库根据层级及粗细由上至下分为业务应用场景-业务描述、业务逻辑元素-实体定义以及业务原子元素-基础口径三个层级;在进行分解和解析时,调用所述场景应用元素库将模型运行所使用到的业务数据分解和解析成业务应用场景-业务描述、业务逻辑元素-实体定义以及业务原子元素-基础口径三个层级。

进一步的,所述上线登记具体为:对接入的模型进行统一登记,生成统一的模型id,归并对应的模型目录库,记录模型的上线信息,所述上线信息包含模型类型、模型名称、创建厂家以及周期;

所述下线登记具体为:对使用频率低于设定值的模型进行下线处理,记录模型的下线信息,所述下线信息包含模型下线日期、模型下线原因以及操作人员;

所述归档管理具体为:对下线的模型进行归档,记录模型的归档信息,所述归档信息包含模型历史使用情况、模型更新次数、数据预测次数、累计使用量以及总体评价结果信息。

进一步的,所述业务应用效果评估反馈具体为:对上线的模型结合场景应用进行综合评估,分析三个周期的预测数据的应用效果,评估的内容至少包括模型周期、模型输出结果量、预警告警处理量、正确反馈量、模型准确率以及正常运行累积时长;

所述业务元素质量评估具体为:从业务元素的筛选与应用角度来对业务元素质量及统计口径合理性、效用性进行评估,使业务元素按照元素特征至少输出属性质量、业务实用质量以及数据保障质量三个方面的评价分析结果,并形成业务元素预选列表;

所述算法效率综合评估具体为:通过模型运行情况及数据算法应用情况,对水务数据算法自身进行综合评价,评价的内容至少包括适用场景特征、数据量效率比、算法平均耗时量、内存资源需求量、优化迭代次数以及模型平均准确率;

所述模型应用评估分析具体为:对模型的具体应用进行综合评估分析,评估分析的内容包括应用描述、模型版本、模型目录以及模型使用四个方面;其中,所述模型描述的内容至少包括模型目标、模型思路、样本构造、模型变量、模型规则以及评估结果,所述模型版本的内容包括历史版本信息以及当前版本信息;所述模型目录的内容为按照业务线条对模型知识库中沉淀的模型结果进行分类维护;所述模型使用的内容至少包括在线模型信息、最新上线列表、最热门列表以及低应用列表。

进一步的,所述迭代配置定义至少包括定义迭代的机制类型、迭代的数据获取接口、迭代的周期、迭代的引擎流程配置以及迭代的制约条件;

所述迭代执行至少包括配置迭代任务执行的资源使用、任务执行的周期控制以及迭代运行的监控;

所述迭代反馈包括设置反馈数据途径,并至少提供业务元素评价反馈、业务支持结果反馈以及排水业务专家人工反馈三个类型的反馈。

第二方面,本发明提供了一种水务大数据挖掘建模管理装置,所述装置包括模型转换模块、发布管理模块、元素分解解析模块、调用配置模块、评估分析模块以及迭代模块;

所述模型转换模块,用于将第三方模型的水务数据建模结果通过标准化的pmml文件接入到模型解析转换服务,并由模型解析转换服务对模型的pmml文件进行解析,以获取模型的相关信息;

所述发布管理模块,用于将模型的pmml文件发布到平台系统上,并对模型进行上线登记、下线登记以及归档管理;

所述元素分解解析模块,用于调用场景应用元素库对模型运行所使用到的业务数据进行场景元素分解和解析,输出业务原子元素清单,并将业务原子元素清单进一步解析形成数据对接接口列表;

所述调用配置模块,用于业务系统基于即将调用的数据挖掘计算需求,根据数据对接接口列表完成业务调用配置,以实现通过水务数据挖掘数据库提供对应的建模标签数据及数据样本,通过水务数据算法封装库提供具体执行的机器学习算法,通过数据挖掘计算引擎提供接口服务;

所述评估分析模块,用于结合数据挖掘计算引擎、水务数据算法封装库和水务挖掘数据库,对上线的模型进行业务应用效果评估反馈、业务元素质量评估、算法效率综合评估以及模型应用评估分析;

所述迭代模块,用于对模型进行优化迭代配置,所述优化迭代配置至少包括迭代配置定义、迭代执行以及迭代反馈三个环节,并根据优化迭代配置对模型进行迭代。

进一步的,所述装置还包括平台结果输出模块;

所述平台结果输出模块,用于通过模型解析转换服务对平台模型结果进行pmml文件构造,将模型参数通过标准化的pmml文件进行输出,并提供模型输入变量的口径以及接口定义文件。

第三方面,本发明提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。

第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的方法。

本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:通过本发明方法来实现智慧水务数据的数据挖掘建模,使得给排水业务专家无需具备数据分析及机器学习等专业知识,只需要基于该方法构建数据挖掘模型,便可实现水务数据的建模与应用,有效的弥补了现有水务行业数据分析、数据挖掘、建模管理等存在的不足之处。将水务传统行业的水力计算经验、给排水业务知识充分融入到水务大数据建模开发中,降低了智慧水务数据分析、数据运营服务的从业人员的技术门槛要求,可带动其他成熟大数据技术及人才的导入,带动水务行业智慧水务数据应用和创新,并带来更多的就业机会。通过数据洞察提升业务优化,基于数据分析能力降低管网漏损率及产销差管理,为水务企业带来更多业务收入,降低业务生产成本,提升水务大数据产业需求,为智慧水务爆发式发展提供基础。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

下面参照附图结合实施例对本发明作进一步的说明。

图1为本发明所涉及的总体技术架构图;

图2为本发明实施例一中方法的执行流程框图;

图3为本发明实施例二中装置的结构示意图;

图4为本发明实施例三中电子设备的结构示意图;

图5为本发明实施例四中介质的结构示意图。

具体实施方式

本申请实施例通过提供一种水务大数据挖掘建模管理方法、装置、设备及介质,解决现有水务数据分析与挖掘主要依靠开发人员来实现,而给排水业务专家因it技术门槛性要求难以参与到水务建模中,导致业务与技术无法充分配合,并带来极大的水务数据挖掘模型的应用难度和复杂度的问题。

本申请实施例中的技术方案,总体思路如下:将水力模型底层算法、常用机器学习算法、水务数据分析算法封装为算法服务库,设计统一的接口组件规范,制定数据组件调用输入输出标准,封装好数据计算服务调用机制;梳理水务主要业务场景,进行业务元素拆解,形成原子级的场景因素,从数据准备、数据预处理、算法服务调用、过程控制等环节配置水务业务元素逻辑,建立水务数据挖掘流程引擎实现业务元素流程封装;制定统一的数据模型解析格式,统一信息字段及元数据管理,以pmml模型格式为主要方式,统一第三方模型的接入导入以及数据挖掘模型建立后的导出文本格式,保障前端页面解析展示与后台文本导入一致,通过线上可见的调度、监控,模型文档管理、状态信息管理实现模型的全流程管理;打通与水务业务支撑系统的互动接口,实现多方式模型输出质量反馈数据采集,包括数据质量反馈、动态监控结果反馈、人工支撑评价反馈等,基于模型应用反馈信息,实现水务模型自优化迭代机制,动态更新水务模型参数,保障应用精准性。

在介绍具体实施例之前,先介绍本申请实施例方法所对应的技术架构,如图1所示,技术架构大概包括模型解析转换服务、场景应用元素库、水务数据算法封装库、数据挖掘计算引擎、模型迭代机制配置、水务挖掘数据库以及水务模型管理七个部分;其中:

所述模型解析转换服务:主要实现第三方模型的接入,以及平台模型的对外发布。模型的接入:通过标准化的pmml文件交付,对pmml内容进行解析,提取数据字典、数据转换、模型表示等信息,通过解析获取相关信息后,对应的模型预测算法将会被表达为数据库所能支持的sql语句(db存储过程)。模型发布:则是需要对平台模型结果进行pmml文件构造,模型参数通过标准化的pmml文件进行输出,并且需要提供模型输入变量的口径、接口定义文件。

所述场景应用元素库:梳理水务主要业务场景,进行业务元素拆解,形成原子级的场景因素,可根据层级及粗细分为业务应用场景-业务描述、业务逻辑元素-实体定义以及业务原子元素-基础口径三个层次,由业务场景自上向下进行应用元素解析与重构,梳理业务场景所需的业务分析逻辑,由业务分析逻辑解析业务原子元素,完成从数据准备、数据预处理、算法服务调用、过程控制等环节配置水务业务元素逻辑。

所述水务数据算法封装库:选择多元化的底层算法封装实现方式,针对机器学习算法库主要基于rhadoop、mahout及sparkmllib等框架进行算法封装库;时空数据算法主要基于gis地理信息空间算法进行封装,数据分析算法则主要基于bi常用分析算法,水力计算算法则是通过集成水务行业开源的epnat及swmm开源水力计算算法组件或函数库进行算法封装。

所述数据挖掘计算引擎:提供水务大数据建模涉及的模型训练、模型预测、参数优化、结果解析等接口服务,通过服务完成数据准备、数据预处理、算法服务调用、过程控制、任务调度等任务,实现挖掘流程封装。

所述模型迭代机制配置:自迭代控制,主要包括迭代配置定义、迭代执行、迭代反馈三个环节;基于迭代配置及迭代反馈情况,进行连续的模型迭代,从而保证模型精准度要求上的稳定,并且通过不断的滚动,不断的优化,使模型结果保持最新,也降低了模型优化的人工成本。

所述水务挖掘数据库:根据水务数据特征及应用场景不同,将底层数据库进行区域划分,实现逻辑与实体的统一,便于后续引入更多数据资源,提高数据资源利用效率;主要分为临时数据交换区、模型管理数据区、模型输入数据区、模型输出数据区、基础建模数据以及个性化建模数据区六大数据库区。

所述水务模型管理:主要是把以往模型线下零散的、不连续的跟踪和管理搬到线上来,并且和模型构建及后面的模型迭代进行打通,主要包括模型建模管理、模型运行动态监控、模型应用评估分析及知识库管理等。

实施例一

本实施例提供一种水务大数据挖掘建模管理方法,如图2所示,所述方法包括:

将第三方模型的水务数据建模结果(即外部厂家通过建模得到的水务数据建模结果)通过标准化的pmml文件接入到模型解析转换服务,并由模型解析转换服务对模型的pmml文件进行解析,以获取模型的相关信息;

将模型的pmml文件发布到平台系统上,并对模型进行上线登记、下线登记以及归档管理;

调用场景应用元素库对模型运行所使用到的业务数据进行场景元素分解和解析,输出业务原子元素清单,并将业务原子元素清单进一步解析形成数据对接接口列表,以实现与水务支撑业务系统进行无缝对接;

业务系统基于即将调用的数据挖掘计算需求,根据数据对接接口列表完成业务调用配置,以实现通过水务数据挖掘数据库提供对应的建模标签数据及数据样本,通过水务数据算法封装库提供具体执行的机器学习算法,通过数据挖掘计算引擎提供接口服务;在此环节中,还包括运行计划、任务监控以及资源监控等内容;其中,运行计划:设置模型跑数执行周期、运行配置以及任务关联等,默认状态下是按月更新模型数据结果;任务监控:模型上线运行需跑数据准备存储过程及模型规则存储过程,调度任务监控提供相关任务异常监控,以及时发现模型运行异常情况;资源监控:主要包括cpu峰值利用率、模型数据的大小、磁盘的有效存储空间利用率、模型更新次数、模型并发数、模型响应时长等资源的监控;

结合数据挖掘计算引擎、水务数据算法封装库和水务挖掘数据库,对上线的模型进行业务应用效果评估反馈、业务元素质量评估、算法效率综合评估以及模型应用评估分析;

对模型进行优化迭代配置,所述优化迭代配置至少包括迭代配置定义、迭代执行以及迭代反馈三个环节,并根据优化迭代配置对模型进行迭代。

在本实施例中,为了实现平台模型的对外发布,所述方法还包括:

通过模型解析转换服务对平台模型结果进行pmml文件构造,将模型参数通过标准化的pmml文件进行输出,并提供模型输入变量的口径以及接口定义文件。

在本实施例中,所述的将第三方模型的水务数据建模结果通过标准化的pmml文件接入到模型解析转换服务,并由模型解析转换服务对模型的pmml文件进行解析具体为:

将第三方模型的模型数据通过数据同步需求开发接入到模型解析转换服务,将第三方模型的模型参数通过标准化的pmml文件交付给模型解析转换服务;模型解析转换服务对交付的pmml文件内容进行解析,以提取数据字典、数据转换、模型表示等相关信息,在解析获取模型的相关信息后,对应的模型预测算法将被表达为数据库所能支持的sql语句(db存储过程);其中,所述pmml文件中至少包括模型输入变量的口径、接口定义、参数说明以及业务元素说明,当然,所述pmml文件中还可以包括其它内容;

所述的调用场景应用元素库对模型运行所使用到的业务数据进行场景元素分解和解析具体为:

所述场景应用元素库根据层级及粗细由上至下分为业务应用场景-业务描述、业务逻辑元素-实体定义以及业务原子元素-基础口径三个层级;在进行分解和解析时,调用所述场景应用元素库将模型运行所使用到的业务数据分解和解析成业务应用场景-业务描述、业务逻辑元素-实体定义以及业务原子元素-基础口径三个层级。

在本实施例中,所述上线登记具体为:对接入的模型进行统一登记,生成统一的模型id,归并对应的模型目录库,记录模型的上线信息,所述上线信息包含模型类型、模型名称、创建厂家以及周期,当然,在具体实施时,还可以根据实际需要来添加其它的上线信息;

所述下线登记具体为:对使用频率低于设定值的模型进行下线处理,记录模型的下线信息,所述下线信息包含模型下线日期、模型下线原因以及操作人员,当然,在具体实施时,还可以根据实际需要来添加其它的下线信息;

所述归档管理具体为:对下线的模型进行归档,记录模型的归档信息,所述归档信息包含模型历史使用情况、模型更新次数、数据预测次数、累计使用量以及总体评价结果信息,当然,在具体实施时,还可以根据实际需要来添加其它的归档信息。

在本实施例中,所述业务应用效果评估反馈具体为:对上线的模型结合场景应用进行综合评估,分析三个周期的预测数据的应用效果,评估的内容至少包括模型周期、模型输出结果量、预警告警处理量、正确反馈量、模型准确率以及正常运行累积时长,当然,在具体实施时,还可以根据实际需要来添加其它的评估的内容;

所述业务元素质量评估具体为:从业务元素的筛选与应用角度来对业务元素质量及统计口径合理性、效用性进行评估,使业务元素按照元素特征至少输出属性质量、业务实用质量以及数据保障质量三个方面的评价分析结果,当然,在具体实施时,还可以根据实际需要来添加其它方面的评价分析结果,并形成业务元素预选列表,以用于后续的数据挖掘建模输入;

所述算法效率综合评估具体为:通过模型运行情况及数据算法应用情况,对水务数据算法自身进行综合评价,评价的内容至少包括适用场景特征、数据量效率比、算法平均耗时量、内存资源需求量、优化迭代次数以及模型平均准确率,当然,在具体实施时,还可以根据实际需要来添加其它的评价的内容;通过算法评估来沉淀算法与应用场景的业务元素适配库,以形成常见的算法分析路径模板;

所述模型应用评估分析具体为:对模型的具体应用进行综合评估分析,评估分析的内容包括应用描述、模型版本、模型目录以及模型使用四个方面;其中,所述模型描述的内容至少包括模型目标、模型思路、样本构造、模型变量、模型规则以及评估结果,当然,在具体实施时,还可以根据实际需要来增加其它的模型描述内容,所述模型版本的内容包括历史版本信息以及当前版本信息;所述模型目录的内容为按照业务线条对模型知识库中沉淀的模型结果进行分类维护;所述模型使用的内容至少包括在线模型信息、最新上线列表、最热门列表以及低应用列表,当然,在具体实施时,还可以根据实际需要来增加其它的模型使用内容。

在本实施例中,所述迭代配置定义至少包括定义迭代的机制类型、迭代的数据获取接口、迭代的周期、迭代的引擎流程配置以及迭代的制约条件,当然,在具体实施时,还可以根据实际需要来增加其它的定义内容;

所述迭代执行至少包括配置迭代任务执行的资源使用、任务执行的周期控制以及迭代运行的监控,当然,在具体实施时,还可以根据实际需要来增加其它的迭代执行内容;

所述迭代反馈包括设置反馈数据途径,并至少提供业务元素评价反馈、业务支持结果反馈以及排水业务专家人工反馈三个类型的反馈,当然,在具体实施时,还可以根据实际需要来增加其它的反馈内容。通过基于迭代配置及迭代反馈情况,进行连续的模型迭代,从而保证模型精准度要求上的稳定,并且通过不断的滚动,不断的优化,使模型结果保持最新。

基于同一发明构思,本申请还提供了与实施例一中的方法对应的装置,详见实施例二。

实施例二

在本实施例中提供了一种水务大数据挖掘建模管理装置,如图3所示,所述装置包括模型转换模块、发布管理模块、元素分解解析模块、调用配置模块、评估分析模块以及迭代模块;

所述模型转换模块,用于将第三方模型的水务数据建模结果(即外部厂家通过建模得到的水务数据建模结果)通过标准化的pmml文件接入到模型解析转换服务,并由模型解析转换服务对模型的pmml文件进行解析,以获取模型的相关信息;

所述发布管理模块,用于将模型的pmml文件发布到平台系统上,并对模型进行上线登记、下线登记以及归档管理;

所述元素分解解析模块,用于调用场景应用元素库对模型运行所使用到的业务数据进行场景元素分解和解析,输出业务原子元素清单,并将业务原子元素清单进一步解析形成数据对接接口列表,以实现与水务支撑业务系统进行无缝对接;

所述调用配置模块,用于业务系统基于即将调用的数据挖掘计算需求,根据数据对接接口列表完成业务调用配置,以实现通过水务数据挖掘数据库提供对应的建模标签数据及数据样本,通过水务数据算法封装库提供具体执行的机器学习算法,通过数据挖掘计算引擎提供接口服务;在此环节中,还包括运行计划、任务监控以及资源监控等内容;其中,运行计划:设置模型跑数执行周期、运行配置以及任务关联等,默认状态下是按月更新模型数据结果;任务监控:模型上线运行需跑数据准备存储过程及模型规则存储过程,调度任务监控提供相关任务异常监控,以及时发现模型运行异常情况;资源监控:主要包括cpu峰值利用率、模型数据的大小、磁盘的有效存储空间利用率、模型更新次数、模型并发数、模型响应时长等资源的监控;

所述评估分析模块,用于结合数据挖掘计算引擎、水务数据算法封装库和水务挖掘数据库,对上线的模型进行业务应用效果评估反馈、业务元素质量评估、算法效率综合评估以及模型应用评估分析;

所述迭代模块,用于对模型进行优化迭代配置,所述优化迭代配置至少包括迭代配置定义、迭代执行以及迭代反馈三个环节,并根据优化迭代配置对模型进行迭代。

在本实施例中,为了实现平台模型的对外发布,所述装置还包括平台结果输出模块;

所述平台结果输出模块,用于通过模型解析转换服务对平台模型结果进行pmml文件构造,将模型参数通过标准化的pmml文件进行输出,并提供模型输入变量的口径以及接口定义文件。

在本实施例中,所述的将第三方模型的水务数据建模结果通过标准化的pmml文件接入到模型解析转换服务,并由模型解析转换服务对模型的pmml文件进行解析具体为:

将第三方模型的模型数据通过数据同步需求开发接入到模型解析转换服务,将第三方模型的模型参数通过标准化的pmml文件交付给模型解析转换服务;模型解析转换服务对交付的pmml文件内容进行解析,以提取数据字典、数据转换、模型表示等相关信息,在解析获取模型的相关信息后,对应的模型预测算法将被表达为数据库所能支持的sql语句(db存储过程);其中,所述pmml文件中至少包括模型输入变量的口径、接口定义、参数说明以及业务元素说明,当然,所述pmml文件中还可以包括其它内容;

所述的调用场景应用元素库对模型运行所使用到的业务数据进行场景元素分解和解析具体为:

所述场景应用元素库根据层级及粗细由上至下分为业务应用场景-业务描述、业务逻辑元素-实体定义以及业务原子元素-基础口径三个层级;在进行分解和解析时,调用所述场景应用元素库将模型运行所使用到的业务数据分解和解析成业务应用场景-业务描述、业务逻辑元素-实体定义以及业务原子元素-基础口径三个层级。

在本实施例中,所述上线登记具体为:对接入的模型进行统一登记,生成统一的模型id,归并对应的模型目录库,记录模型的上线信息,所述上线信息包含模型类型、模型名称、创建厂家以及周期,当然,在具体实施时,还可以根据实际需要来添加其它的上线信息;

所述下线登记具体为:对使用频率低于设定值的模型进行下线处理,记录模型的下线信息,所述下线信息包含模型下线日期、模型下线原因以及操作人员,当然,在具体实施时,还可以根据实际需要来添加其它的下线信息;

所述归档管理具体为:对下线的模型进行归档,记录模型的归档信息,所述归档信息包含模型历史使用情况、模型更新次数、数据预测次数、累计使用量以及总体评价结果信息,当然,在具体实施时,还可以根据实际需要来添加其它的归档信息。

在本实施例中,所述业务应用效果评估反馈具体为:对上线的模型结合场景应用进行综合评估,分析三个周期的预测数据的应用效果,评估的内容至少包括模型周期、模型输出结果量、预警告警处理量、正确反馈量、模型准确率以及正常运行累积时长,当然,在具体实施时,还可以根据实际需要来添加其它的评估的内容;

所述业务元素质量评估具体为:从业务元素的筛选与应用角度来对业务元素质量及统计口径合理性、效用性进行评估,使业务元素按照元素特征至少输出属性质量、业务实用质量以及数据保障质量三个方面的评价分析结果,当然,在具体实施时,还可以根据实际需要来添加其它方面的评价分析结果,并形成业务元素预选列表,以用于后续的数据挖掘建模输入;

所述算法效率综合评估具体为:通过模型运行情况及数据算法应用情况,对水务数据算法自身进行综合评价,评价的内容至少包括适用场景特征、数据量效率比、算法平均耗时量、内存资源需求量、优化迭代次数以及模型平均准确率,当然,在具体实施时,还可以根据实际需要来添加其它的评价的内容;通过算法评估来沉淀算法与应用场景的业务元素适配库,以形成常见的算法分析路径模板;

所述模型应用评估分析具体为:对模型的具体应用进行综合评估分析,评估分析的内容包括应用描述、模型版本、模型目录以及模型使用四个方面;其中,所述模型描述的内容至少包括模型目标、模型思路、样本构造、模型变量、模型规则以及评估结果,当然,在具体实施时,还可以根据实际需要来增加其它的模型描述内容,所述模型版本的内容包括历史版本信息以及当前版本信息;所述模型目录的内容为按照业务线条对模型知识库中沉淀的模型结果进行分类维护;所述模型使用的内容至少包括在线模型信息、最新上线列表、最热门列表以及低应用列表,当然,在具体实施时,还可以根据实际需要来增加其它的模型使用内容。

在本实施例中,所述迭代配置定义至少包括定义迭代的机制类型、迭代的数据获取接口、迭代的周期、迭代的引擎流程配置以及迭代的制约条件,当然,在具体实施时,还可以根据实际需要来增加其它的定义内容;

所述迭代执行至少包括配置迭代任务执行的资源使用、任务执行的周期控制以及迭代运行的监控,当然,在具体实施时,还可以根据实际需要来增加其它的迭代执行内容;

所述迭代反馈包括设置反馈数据途径,并至少提供业务元素评价反馈、业务支持结果反馈以及排水业务专家人工反馈三个类型的反馈,当然,在具体实施时,还可以根据实际需要来增加其它的反馈内容。通过基于迭代配置及迭代反馈情况,进行连续的模型迭代,从而保证模型精准度要求上的稳定,并且通过不断的滚动,不断的优化,使模型结果保持最新。

由于本发明实施例二所介绍的装置,为实施本发明实施例一的方法所采用的装置,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的装置都属于本发明所欲保护的范围。

基于同一发明构思,本申请提供了实施例一对应的电子设备实施例,详见实施例三。

实施例三

本实施例提供了一种电子设备,如图4所示,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,可以实现实施例一中任一实施方式。

由于本实施例所介绍的电子设备为实施本申请实施例一中方法所采用的设备,故而基于本申请实施例一中所介绍的方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本申请实施例中的方法不再详细介绍。只要本领域所属技术人员实施本申请实施例中的方法所采用的设备,都属于本申请所欲保护的范围。

基于同一发明构思,本申请提供了实施例一对应的存储介质,详见实施例四。

实施例四

本实施例提供一种计算机可读存储介质,如图5所示,其上存储有计算机程序,该计算机程序被处理器执行时,可以实现实施例一中任一实施方式。

本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、装置、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本申请实施例中提供的技术方案,至少具有如下技术效果或优点:通过本发明方法来实现智慧水务数据的数据挖掘建模,使得给排水业务专家无需具备数据分析及机器学习等专业知识,只需要基于该方法构建数据挖掘模型,便可实现水务数据的建模与应用,有效的弥补了现有水务行业数据分析、数据挖掘、建模管理等存在的不足之处。将水务传统行业的水力计算经验、给排水业务知识充分融入到水务大数据建模开发中,降低了智慧水务数据分析、数据运营服务的从业人员的技术门槛要求,可带动其他成熟大数据技术及人才的导入,带动水务行业智慧水务数据应用和创新,并带来更多的就业机会。通过数据洞察提升业务优化,基于数据分析能力降低管网漏损率及产销差管理,为水务企业带来更多业务收入,降低业务生产成本,提升水务大数据产业需求,为智慧水务爆发式发展提供基础。

虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1