一种基于高斯分布的用水量曲线样本模拟方法与流程

文档序号:31364281发布日期:2022-08-31 15:14阅读:38来源:国知局

1.本发明涉及用水量异常检测技术领域,尤其是一种基于高斯分布的用水量曲线样本模拟方法。


背景技术:

2.中国是一个人口大国,自然也是一个用水大国。自来水早已成为居民日常生活的主要用水来源。自来水是从自来水厂通过管网输送至每家每户的,各种原因可能导致埋设在地下的输送管网出现渗水问题。据统计,自来水经官网输送过程中,存在近30%的损耗,而管网渗漏是导致损耗的主要原因之一。然而,输送官网埋设在地下,渗漏部位查找困难,导致管网渗漏问题难以解决。除管网输送过程中各级管道发生渗漏问题外,居民家中、自来水井中的漏水现象也较为常见,尤其是家中无人时发生漏水问题,很容易形成室内积水,给业主带来较大的财产损失。
3.利用机器学习对用水量曲线进行异常检测,是近年来兴起的一种新型检测方法。在机器学习中,样本数量及质量至关重要。然而,异常情形下的用水量曲线样本非常难以获得的,因为漏水等用水异常都是低概率事件。
4.现有异常用水量样本获取方式有以下三种:1、从海量用水量曲线中人工筛选出异常用水量样本,但是这项工作也是非常困难的,因为相比于极高比例的正常样本,异常用水量样本是极其稀疏的,可能耗费大量时间才能找到一个异常样本;2、随机生成异常用水量曲线样本,但是与真实的异常用水量样本差异太大,不利于机器学习网络的训练;3、利用真实用水量曲线拼接形成异常用水量曲线样本,同样存在不真实的问题,机器学习网络无法从中学习到真实异常用水量样本的规律。
5.综上所述,异常用水量样本的获取难,是利用机器学习对用水量曲线进行异常检测的最大阻碍。


技术实现要素:

6.针对异常用水量样本难以获取的问题,本发明提供了一种基于高斯分布的用水量曲线样本模拟方法,对正常用水量样本和异常用水量进行模拟,形成符合实际用水量的用水量曲线样本,用于机器学习网络的训练。
7.一种基于高斯分布的用水量曲线样本模拟方法,包括异常用水量曲线样本模拟,将每隔t时间计算一次前t时间内的累计用水量,作为1个数据点,拟合n个连续数据点形成一条用水量曲线图,将该用水量曲线图定义为用水量曲线样本。
8.异常用水量曲线样本模拟至少涉及以下因素:

水管爆裂漏水;

水龙头打开后未关闭。
9.从多参数角度模拟水管爆裂漏水,多参数包括但不限于单位时间内的漏水量、漏水点数量、漏水持续时间,在经验数据约束下,基于高斯分布生成各个参数值,再根据各个参数值,得到因水管爆裂漏水产生的异常用水量曲线样本。
10.从多参数角度模拟水龙头打开后未关闭,多参数包括但不限于未关闭水龙头数量、水龙头单位时间内的水流量、水龙头打开持续时间,在经验数据约束下,基于高斯分布生成各个参数值,得到因水龙头打开后未关闭产生的异常用水量曲线样本。
11.优选的,异常用水量曲线样本是每隔5分钟计算一次前5分钟时间内的累计用水量,作为1个数据点,拟合16个连续数据点形成。
12.优选的,异常用水量曲线样本模拟还涉及因素:反复开关水龙头;
13.统计正常各种类型水龙头24小时内正常使用次数的区间,在正常使用次数区间的5-10倍范围内,基于高斯分布生成各种类型水龙头的异常使用次数区间,再针对每一次水龙头异常使用随机生成一个打开时间和关闭时间,若存在时间段交叠,则删除前一次或后一次时间段,计算得到24小时内反复开关水龙头产生的异常用水量曲线;
14.针对24小时内反复开关水龙头产生的异常用水量曲线,利用75分钟的时间窗在该异常用水量曲线上遍历,截取若干75分钟的异常用水量曲线样本。
15.优选的,还包括正常用水量曲线样本模拟,正常用水量曲线样本模拟包括以下步骤:
16.步骤1,统计各种户型模型,户型模型数据至少包含厨房数量、卫生间数量、洗衣区数量;
17.步骤2,在户型模型数据约束下,基于高斯分布生成各种类型水龙头的数量,不同类型水龙头指的是用于不同场景下的水龙头,不同场景包括但不限于厨房水槽、淋浴间、浴室柜、洗衣机、马桶、热水器;
18.步骤3,在户型模型数据约束下,基于高斯分布生成每户家庭中各类家庭成员的数量,各类家庭成员包括但不限于成年人、老年人、儿童、佣人;
19.步骤4,针对每户家庭中的每一位家庭成员,生成24小时的用水量曲线;
20.步骤5,叠加将该户家庭中所有家庭成员的24小时用水量曲线,得到该户家庭的24小时用水量曲线;
21.步骤6,24小时用水量曲线中,每隔5分钟计算一次前5分钟时间内的累计用水量,作为1个数据点,依次拟合连续的16个数据点作为一段正常用水量曲线样本。
22.优选的,所述步骤4具体包括以下步骤:
23.步骤4.1,根据家庭成员类型,在经验数据约束下,基于高斯分布生成该家庭成员24小时内实施的各种活动的次数、起始时间和时长;
24.步骤4.2,针对每一次活动,基于高斯分布生成拟制用水量;
25.步骤4.3,叠加该家庭成员24小时内实施的所有活动的拟制用水量,得到该家庭成员24小时的用水量曲线。
26.优选的,对异常用水量曲线样本进行人工核查,去除极其不合理的曲线样本,形成用水量曲线样本库。
27.本发明有益效果:1、从通过户型模型、家庭成员、居民生活习惯等方面模拟正常用水量曲线样本,从多参数角度模拟水管爆裂漏水、水龙头打开后未关闭、反复开关水龙头等异常因素,进行异常用水量曲线样本模拟,使得最终得到的用水量曲线样本更加贴近生活,更加真实,利于机器学习网络发现漏水现象与正常现象之间的内在规律和差异;2、无需在海量稀疏样本中进行人工筛选,大幅度节省了人力成本;3、提供了一种模拟异常用水量曲
线样本的思路,易于根据实际情况进行多样化配置,模拟最贴合实际的异常用水情况。
具体实施方式
28.下面结合具体实施方式对本发明作进一步详细的说明。本发明的实施例是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显而易见的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。
29.实施例1
30.一种基于高斯分布的用水量曲线样本模拟方法,包括异常用水量曲线样本模拟,将每隔t时间计算一次前t时间内的累计用水量,作为1个数据点,拟合n个连续数据点形成一条用水量曲线图,将该用水量曲线图定义为用水量曲线样本。
31.异常用水量曲线样本模拟至少涉及以下因素:

水管爆裂漏水;

水龙头打开后未关闭。
32.从多参数角度模拟水管爆裂漏水,多参数包括但不限于单位时间内的漏水量、漏水点数量、漏水持续时间,在经验数据约束下,基于高斯分布生成各个参数值,再根据各个参数值,得到因水管爆裂漏水产生的异常用水量曲线样本。
33.从多参数角度模拟水龙头打开后未关闭,多参数包括但不限于未关闭水龙头数量、水龙头单位时间内的水流量、水龙头打开持续时间,在经验数据约束下,基于高斯分布生成各个参数值,得到因水龙头打开后未关闭产生的异常用水量曲线样本。
34.异常用水量曲线样本是每隔5分钟计算一次前5分钟时间内的累计用水量,作为1个数据点,拟合16个连续数据点形成。这是根据大量经验总结选定的,计算累计用水量的时间间隔不宜太长,也不宜太短,时间太长则不利于快速反应,时间太短则用水量测量不准,同时也耗费更多电量及网络流量等资源;一条曲线样本数据点太多,则覆盖的时间跨度较大,异常情况测量就不够灵敏了,数据点太少,则容易受到瞬时用水习惯的影响,影响检测结果。
35.异常用水量曲线样本模拟还涉及因素:反复开关水龙头。
36.统计正常各种类型水龙头24小时内正常使用次数的区间,在正常使用次数区间的5-10倍范围内,基于高斯分布生成各种类型水龙头的异常使用次数区间,再针对每一次水龙头异常使用随机生成一个打开时间和关闭时间,若存在时间段交叠,则删除前一次或后一次时间段,计算得到24小时内反复开关水龙头产生的异常用水量曲线;
37.针对24小时内反复开关水龙头产生的异常用水量曲线,利用75分钟的时间窗在该异常用水量曲线上遍历,截取若干75分钟的异常用水量曲线样本。
38.虽然正常用水量曲线样本相对于异常用水量曲线样本比较好获取,但是也需要耗费人力,为此,本实施例也提供正常用水量曲线样本模拟方法,包括以下步骤:
39.步骤1,统计各种户型模型,户型模型数据至少包含厨房数量、卫生间数量、洗衣区数量,相当于日常生活中经常提及的一厨一卫、一厨两卫、两厨三卫等概念;
40.步骤2,在户型模型数据约束下(例如一厨一卫,通常只有1-2个厨房水槽龙头、1个淋浴龙头、1个浴室柜龙头、1个马桶龙头,而一厨两卫通常只有1-2个厨房水槽龙头、1-2个
淋浴龙头、1-2个浴室柜龙头、2个马桶龙头),基于高斯分布生成各种类型水龙头的数量,不同类型水龙头指的是用于不同场景下的水龙头,不同场景包括但不限于厨房水槽、淋浴间、浴室柜、洗衣机、马桶、热水器;
41.步骤3,在户型模型数据约束下,基于高斯分布生成每户家庭中各类家庭成员的数量,各类家庭成员包括但不限于成年人、老年人、儿童、佣人,例如一室一厅一卫的户型,三室二厅两卫的户型,以及独栋别墅能够居住的家庭成员数量是不同的,因此基于高斯分布生成的每户家庭中各类家庭成员数量需在此约束范围内;
42.步骤4,针对每户家庭中的每一位家庭成员,生成24小时的用水量曲线,具体包括:
43.步骤4.1,根据家庭成员类型,在经验数据约束下(例如儿童在厨房用水的活动次数通常较少,佣人在厨房、洗衣区活动的次数较多),基于高斯分布生成该家庭成员24小时内实施的各种活动的次数、起始时间和时长;
44.步骤4.2,针对每一次活动,基于高斯分布生成拟制用水量;
45.步骤4.3,叠加该家庭成员24小时内实施的所有活动的拟制用水量,得到该家庭成员24小时的用水量曲线;
46.步骤5,叠加将该户家庭中所有家庭成员的24小时用水量曲线,得到该户家庭的24小时用水量曲线;
47.步骤6,24小时用水量曲线中,每隔5分钟计算一次前5分钟时间内的累计用水量,作为1个数据点,依次拟合连续的16个数据点作为一段正常用水量曲线样本。
48.为进一步提高基于本发明生成的用水量曲线样本的训练效果,对异常用水量曲线样本和进行人工核查,去除极其不合理的曲线样本,形成用水量曲线样本库,防止影响网络训练结果。极其不合理的曲线样本可以包括漏水量远大于正常值或多种异常因素同时爆发且时间长等明显不符合生活规律的曲线样本。
49.显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域及相关领域的普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1