一种基于信息挖掘的室内人员状态特征和多种用能需求估计方法

文档序号:35022565发布日期:2023-08-04 18:23阅读:28来源:国知局
一种基于信息挖掘的室内人员状态特征和多种用能需求估计方法

本发明涉及对建筑内多种用能需求估计的一种方法,尤其涉及一种基于信息挖掘的室内人员状态特征和多种用能需求估计方法,属于建筑能耗精准预测领域。


背景技术:

1、随着人民生活水平的不断提高,室内环境的舒适性变得越来越重要,这就使得暖通空调系统在建筑中的运用不断加深,然而这也带来了很严峻的能源问题。据统计,建筑领域能耗已占到全球能源消费总量的40%,而公共建筑中40%的能耗来源于暖通空调系统。因此,建筑在设计阶段、运行阶段的节能优化有着重大的意义。其中,合理的能耗预测是上述措施的重要环节,对公共建筑多种用能的供需匹配以及暖通空调的精细化管理有着关键的作用。然而,现有研究的用能需求预测往往与实际的能耗水平有很大差异,这也使后续的公共建筑节能改造与暖通空调系统的精细化管理达不到理想的效果。归其原因:一方面,由于不同个体的适应性差异,基于群体的热舒适性区域是一个较宽的范围而不是一个设定点,而不合理的设定点必然会引起过冷或过热,从产生了极不必要的能源浪费;另一方面,现有建筑用能需求预测没有将“人”作为变量考虑进模型的建立之中,人的主观感受与随机行为和预测过程完全脱节。因此,将室内人员状态特征进行信息挖掘加入到建筑用能需求预测上,对于提高预测精度以及维持室内环境的舒适性有着重要的作用。现有的建筑能耗预测主要有两种传统模型:数据驱动模型、物理模型。数据驱动模型是以机器学习算法或者深度学习算法,通过历史记录的时间序列数据,对用能需求进行建模。物理模型依赖于热力学规则和建筑本身的特性对建筑部件、以及各个系统进行建模,从而输出建筑能耗以及室内的环境。但是上述两种模型都有其局限性和优点。前者可以捕获复杂系统中的非线性关系,但是往往需要大量的历史数据,对于传感器的要求较高,而且其在描述能耗与建筑的关系时,可解释性较差,无法在训练范围外很好的进行泛化。而后者虽然减少了模型所需数据的探测工作,但是对于人员行为的模拟需要手动输入其日程安排,无法保证其随机性。本发明提出了一种基于信息挖掘的室内人员状态特征和多种用能需求估计方法,旨在通过将数据驱动模型和物理模型相结合,对室内人员状态特征状态进行信息挖掘,从而达到提高建筑能耗预测精度的目的,为多能联供系统的供需匹配以及暖通空调系统的精细化控制打下基础。


技术实现思路

1、本发明要解决的技术问题是提供一种基于信息挖掘的室内人员状态特征和多种用能需求估计方法,用以改善建筑能耗预测精度与动态变化。

2、本发明的技术方案:一种基于信息挖掘的室内人员状态特征和多种用能需求估计方法,运用数据挖掘技术,综合了物理模型与数据驱动模型的特点,刻画了人行为的影响,精准预测能耗,具体步骤如下:

3、s1、数据采集与数据预处理:

4、s1.1、数据采集

5、采集的数据分为两部分,一部分是以人员本身为基础的人员身体信息,一部分是以人员行为为基础的人员动作信息。人员身体信息包括:人体皮肤温度tskin、人员在室停留时间rst,人员不同房间停留比例rsp及人员是否在室。同时对空调温度设定值tset、室内温度tin、室内相对湿度rhin、室外温度tout、室外相对湿度rhout、降水情况、太阳辐射照度is、室外风速vd、空气质量指数aqi这些连续性变量以及工作日情况、时段分类变量进行记录。人员动作信息包括:窗户开闭情况、遮阳开闭情况、空调控制器开闭情况、恒温器调节情况,同时还要对建筑用能进行收集。

6、s1.2、数据预处理技术

7、数据预处理主要包括数据清洗、数据集成、数据转换和数据归约。

8、进一步的,所述数据清洗:

9、对连续缺失数据直接对元组进行删除。对于非连续性缺失数据采用指数加权滑动平均法对空白值进行填充:

10、pt=w·pt-1+(1-w)·xt     (1)

11、

12、其中pt为当前时刻滑动平均值,pt-1为上一时刻滑动平均值,pbiased_t为t较小时的修正滑动平均值,t为时刻,xt为当前时刻的观测值;w为衰减权重,范围在0-1之间,控制着模型更新速度,越大越趋于稳定,取接近1的常数。

13、对于异常数据的离群点识别采用k-means算法:样本所属类别标签是未知的,通过样本特征对样本进行分类,通过最小化所属样本到所属类别中心的欧式距离和,最后达到收敛:

14、

15、

16、

17、其中x(i)为i个训练样本,μj为j个聚类中心,c(i)为样本到类别中心欧氏距离最小的类别,式(4)为样本中心的更新,即样本j的样本均值,为所属欧氏距离最小的类别中心,j(c,μ)为损失函数,式(5)为所有样本到其类别中心的欧氏距离平方和,使其达到收敛,从而确定最优的c(i)。

18、进一步的,所述的数据集成与数据转换:

19、通过计算皮尔森相关系数消除和避免冗余性:

20、

21、其中,ra,b为相关系数,a[n]表示a类数据共n个,b[n]表示b类数据共n个,n表示数据个数,为样本均值,σa为a向量的无偏标准差,σb为b向量的无偏标准差。

22、数据转换运用数据最小-最大规范化方法,最小-最大规范化方法如下所示:

23、

24、进一步的,所述的数据归约:

25、运用维度归约中的特征选择,选择最佳子集,进行向后选择,提高算法效率,进而优化数据驱动模型。

26、最后对数据进行拆分,按比例随机对数据进行拆分成训练集和测试集,分别用作后续模型的建立以及评价。

27、s2、人员模型的建立:

28、s2.1、人员移动模型的建立

29、基于马尔科夫链和事件机制建立人员移动模型,以马尔可夫链的随机跳转过程类比人的随机移动情况,根据室内人员当前时刻的位置及转移矩阵p,基于条件概率预测人员下一时刻的位置,揭示不同人员在建筑空间中的移动过程并刻画人员的在室情况,模型如下所示:

30、

31、

32、

33、p(rsta=k)=paak(1-paa)        (11)

34、其中,pab为转移概率,为k时刻人员移动发生情况,a、b为不同的空间状态,rsta为在a状态下停留的时间,k为时间步长,p(rsta=k)为马尔可夫链在以进入a状态开始,k个时间步长后离开状态a的概率。当人员在k时刻发生移动时,必然从一个状态点a移动到另一个状态点b,则此时为1,移动事件发生,反之人员没有移动,状态保持不变。

35、s2.2、人员行为模型的建立

36、首先,采用相关性检验衡量二分类变量与连续性变量的相关性,相关性检验采用point-biserial相关系数检验方法,具体求解方法如下:

37、

38、其中,rpb为相关系数,为二分类变量在1、0时连续变量的均值,,m1、m0为二分类变量分别在1、0时的频数,m为二分类变量的变量个数,为连续变量的标准偏差(其中n为连续变量的变量个数,yi为连续变量样本值,为连续变量样本均值)。

39、在衡量出不同因变量与自变量的相关性后,开始建立人员行为模型,进行行为预测。采用支持向量机算法svm进行模型的训练,在svm算法中通过不同的核函数将数据点映射到高维空间中,并在该空间中构建一个最优的超平面。这个超平面可以最大程度地分割不同类别的数据点,并最小化分类误差。原理如下:

40、ωtx+β=0          (13)

41、

42、

43、s.t. yg(ωtxg+β)≥1-ξg        (16)

44、ξg≥0,g=1,2,…,n        (17)

45、其中,x为样本特征向量,ω为法向量,β为位移项,γ为间隔,为优化目标,使其最小,c为惩罚参数用于平衡分类错误和模型复杂度,ξg为松弛变量用于允许某些样本误分类或距超平面很近,g为下标,即样本总数为n。

46、s3、混合模型的建立

47、混合模型的建立采用物理模型与数据驱动模型相叠加,以物理仿真模型为基础平台,提供建筑热工参数以及天气情况,将人员移动模型以及人员行为模型输入到物理模型。物理模型提供基础,数据驱动模型提供与人有关的随机变量,最后集成的混合模型去预测建筑未来一段时间内用能需求。

48、s4、混合模型性能评价

49、对于预测生成的用能情况,需要与原始数据进行比较,确定预测情况。以平均绝对百分比误差mape、均方根误差rmse、变异系数cv对混合模型进行评价,计算是否符合精准预测。具体计算公式如下:

50、

51、

52、

53、其中,表示预测值,yi表示真实值。mape越接近0%,混合模型越完美;rmse越小,计算结果越好;cv越小,说明预测值与实际值之间离散程度越小,混合模型越成功。

54、本发明运用数据挖掘技术,将“人”的影响运用数据表达出来,加入到以传统物理模型为基础的仿真平台,克服了传统物理模型无法刻画人行为的问题。同时该方法可以更好的对不同建筑进行模型迁移,使得数据驱动模型可以更好的进行泛化。

55、与现有技术相比,该发明的有益效果:提供了一种基于信息挖掘的室内人员状态特征和多种用能需求估计方法,综合了物理模型与数据驱动模型的特点,将人的影响加入到模型的搭建当中,使得预测结果更加准确。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1