一种基于LSTM的智能家电用户行为预测方法和装置与流程

文档序号:16391936发布日期:2018-12-25 19:23阅读:261来源:国知局
一种基于LSTM的智能家电用户行为预测方法和装置与流程

本发明涉及家用电器的预测技术领域,具体而言,尤其涉及基于lstm的智能家电用户行为预测方法和装置。

背景技术

随着人工智能、物联网技术、大数据计算、传感器技术等技术的发展,智能家电已经逐步进入人类的日常生活,智能家电通过特定的人性化功能,为用户提供全方位的信息交互功能,为消费者提供更人性化、更健康环保、更节能的使用体验。在我国家电行业,智能家电正处于高速发展的阶段,智能家电生产企业越来越重视对高端智能化产品的研究,特别是对企业未来品牌发展和客户需求升级转型的深入研究,各大家电厂商争相发布各高端智能化产品。但是,目前智能家电还不能很好的体现其智能所在,对用户行为的预测还不够精确,无法准确的结合用户的具体生活习惯为用户提供个性化的服务,也在一定程度上限制了智能家电的发展。



技术实现要素:

根据上述提出目前智能家电还不能很好的体现其智能所在,对用户行为的预测还不够精确,无法准确的结合用户的具体生活习惯为用户提供个性化的服务的技术问题,而提供一种基于lstm的智能家电用户行为预测方法。

本发明主要利用基于lstm的智能家电用户行为的预测方法,其特征在于,包括:s1:采集并储存用户家电使用的行为数据;s2:筛选并提取所述储存用户家电使用的行为数据;s3:对所述的行为数据进行预处理,按比例获得训练集、验证集和测试集;s4:将所述训练集输入长短期记忆网络lstm模型训练数据,得到训练后的模型;s5:将所述测试集输入所述训练后的模型得到预测数据。

进一步的,所述行为数据进行预处理,得到训练集和测试集,包括:

s31:将所述训练数据进行转换处理,得到转换处理后的训练数据;

s32:对所述转换处理的训练数据进行归一化操作,得到归一化后的训练数据;

s33:对所述归一化后的训练数据按比例切分,得到所述训练集、验证集和测试集。

更进一步的,所述归一化处理为:对所述筛选后的行为数据进行线性变换,把所述筛选后的行为数据映射到[0,1]区间,转换函数如下:

其中max表示样本数据的最大值,min表示样本数据的最小值,x表示样本归一化前的值,x*表示归一化后的值。

进一步的,所述得到预测数据还包括:

s41:利用所述训练集训练lstm模型,输入验证集选择模型超参数得到训练后的模型;

s42:将所述测试集输入所述的训练的模型,进行外循环初始化,设定层数d=1并进行设定误差值的设置;

s43:进行内循环初始化,设定迭代次数n=1;设定当前最小误差为无穷大,设定最大迭代次数nmax;

s44:基于结构风险最小化原理,利用训练集数据进行lstm循环神经网络的训练;将验证集数据输入训练好的lstm循环神经网络,利用经验风险函数计算验证集误差;

s45:比较验证集与最小误差的大小;若验证集误差大于或等于最小误差,则迭代次数加1;若验证集误差小于当前最小误差,则将验证集误差的值赋予当前最小误差,则把当前lstm循环神经网络作为当前最优网络,更新并且存储最优网络的参数和验证集误差;

s46:比较验证集误差与设定误差的大小;若验证集误差小于设定误差,验证集误差大于或等于设定误差,则迭代次数n+1;若迭代次数小于或者等于最大迭代次数,则进行lstm循环神经网络的训练;若迭代次数大于最大迭代次数则层数d+1,则判断层数d与最大设定层数dmax;

s47:比较层数d与最大设定层数dmax的大小;若层数d大于最大设定层数dmax,则选取验证集误差最小的最优网络,并读取所对应的lstm循环神经网络的参数;若层数d小于或等于最大设定层数dmax则执行步骤s43;输入神经网络参数确定lstm循环神经网络的用户行为预测模型。

进一步的,所述采集设定时间段内的用户家电使用行为数据,还包括:该时间段内用户对家电设备的操作事件,以及每个操作事件前对应家电设备的操作状态,操作事件本身的操作状态和每个事件触发后的操作状态;该时间段内家电设备的状态信息变化情况,包括时段开始时的家电设备状态信息和时段结束时的家电设备状态。

进一步的所述筛选提取所述存储的用户历史行为数据,包括:判断所述的用户行为数据是否有异常数据,所述异常数据包括用户对家电设备的异常操作数据,以及家电设备的异常状态数据,筛选提取去除明显异常后的用户行为数据。

本发明还包含一种应用预测方法的一种基于lstm的智能家电用户行为的预测装置,其特征在于,至少包括:

采集并储存用户家电使用的行为数据的数据采集存储单元;筛选并提取所述储存用户家电使用的行为数据行为数的提取单元;对所述的行为数据进行预处理,得到训练集和测试集的预处理单元;将所述训练集输入长短期记忆网络lstm模型训练数据,得到训练后模型的模型训练单元;将所述测试集输入所述训练后的模型得到预测数据的预测输出单元。

更进一步的,所述预处理单元具体用于:将所述训练数据进行转换处理,得到转换处理后的训练数据;对所述转换处理的训练数据进行归一化操作,得到归一化后的训练数据;对所述归一化的训练数据进行切分,得到所述训练集、验证集和测试集。

进一步的,利用所述训练集训练lstm模型,利用验证集选择模型超参数,得到训练后的模型。进一步的,所述预测输出单元用于:将所述测试集输入所述的训练好的用户行为预测模型,得到所述的预测行为数据。

本发明的优点在于:本发明采用lstm模型构建家电用户行为预测模型,长短时记忆网络上的链式结构本质上是序列和列表信息相关的,适合处理时间序列相关问题,能更好的预测周期性数据;同时,本发明采用基于结构风险最小化原理训练神经网络,结构风险最小化在经验风险最小化的基础上加上表示模型复杂度的正则化项,适用于样本容量偏少时经验风险最小化容易产生过拟合的问题,更适用于单个用户的家电使用行为预测模型训练。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明总体流程示意图。

图2为本发明预测数据流程示意图。

图3为本发明预测装置示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

如图1所示为一种基于lstm的智能家电用户行为的预测方法,包括:

在本实施方式中,采集并储存用户家电使用的行为数据。在本实施方式中,提取的行为数据包括家电的使用信息,如每天哪个时间点打开空调,打开多长时间,运行的时候设置温度是多少,设置的模式是制冷模式还是制热模式等等;热水器行为数据包括每天是什么时候开始加热,每天什么时间开始用水,用水多长时间,放水时候的热水温度是多少等等。

在本实施方式中,筛选并提取所述储存用户家电使用的行为数据。可以理解为在筛选过程中需要排除有缺失信息的记录。当记录中主要信息缺失,尤其是丢失较多关键信息的时候,数据已经不能够反应其所能够代表的信息,这时就可以将记录某条记录删除排除明显错误数据,例如:采集的空调和热水器数据连续缺失几天的数据。同时筛选排除明显异常数据,例如热水设置温度最高75度,如果采集的数据中设置温度超过75甚至更高,说明数据有问题,也需要排除。

进一步的,作为优选的实施方式对所述的行为数据进行预处理,按比例获得训练集、验证集和测试集。所述选择比例一般为6:2:2,可以理解为,在其他实施方式中,选择的比例可以按照实际情况进行选择,只要能够满足训练集的数据量>验证集的数据量≈测试集的数据量即可。

在本实施方式中,将所述训练数据进行转换处理,得到转换处理后的训练数据。可以理解为,采集的行为数据有些不是直接的数据,例如采集热水器本次放水放了多长时间,但是从热水器直接采集的只有什么时候开始放水,什么时候关闭放水,中间时间差就是本次放水时间,转换处理就是将原先不能直接处理的数据转换成可以直接使用的数据。

作为优选的实施方式,对所述转换处理的训练数据进行归一化操作,得到归一化后的训练数据;归一化处理为:对所述筛选后的行为数据进行线性变换,把所述筛选后的行为数据映射到[0,1]区间,转换函数如下:

其中max表示样本数据的最大值,min表示样本数据的最小值,x表示样本归一化前的值,x*表示归一化后的值。进一步的,在本实施方式中,对所述归一化后的训练数据按比例切分,得到所述训练集、验证集和测试集。在本实施方式中切分数据的比例一般采用6:2:2,可以理解为,在其他实施方式中,选择的比例可以按照实际情况进行选择,只要能够满足训练集的数据量>验证集的数据量≈测试集的数据量即可。

作为优选的试试方式,将所述训练集输入长短期记忆网络lstm模型训练数据,得到训练后的模型。如图2所示,利用所述训练集训练lstm模型,输入验证集选择模型超参数得到训练后的模型并将所述测试集输入所述的训练的模型,进行外循环初始化,设定层数d=1并进行设定误差值的设置。进行内循环初始化,设定迭代次数n=1;设定当前最小误差为无穷大,设定最大迭代次数nmax;

在本实施方式中采用结构风险最小化原理,利用训练集数据进行lstm循环神经网络的训练;将验证集数据输入训练好的lstm循环神经网络,利用经验风险函数计算验证集误差。可以理解为,在其他实施方式中,还可以采用其他方式训练数据,只要能够满足能够验证数据的误差即可。

在本实施方式中,比较验证集与最小误差的大小;若验证集误差大于或等于最小误差,则迭代次数加1;若验证集误差小于当前最小误差,则将验证集误差的值赋予当前最小误差,则把当前lstm循环神经网络作为当前最优网络,更新并且存储最优网络的参数和验证集误差。进而比较验证集误差与设定误差的大小;若验证集误差小于设定误差,验证集误差大于或等于设定误差,则迭代次数n+1;若迭代次数小于或者等于最大迭代次数,则进行lstm循环神经网络的训练;若迭代次数大于最大迭代次数则层数d+1,则判断层数d与最大设定层数dmax。最后,比较层数d与最大设定层数dmax的大小;若层数d大于最大设定层数dmax,则选取验证集误差最小的最优网络,并读取所对应的lstm循环神经网络的参数;若层数d小于或等于最大设定层数dmax,则执行设定层数d=1并进行设定误差值的设置。进行内循环初始化,设定迭代次数n=1;设定当前最小误差为无穷大,设定最大迭代次数dmax;输入神经网络参数确定lstm循环神经网络的用户行为预测模型。将所述测试集输入所述训练后的模型得到预测数据。

在本实施方式中,采集设定时间段内的用户家电使用行为数据,还包括:该时间段内用户对家电设备的操作事件,以及每个操作事件前对应家电设备的操作状态,操作事件本身的操作状态和每个事件触发后的操作状态;该时间段内家电设备的状态信息变化情况,包括时段开始时的家电设备状态信息和时段结束时的家电设备状态。可以理解为在本实施方式中所说的操作事件包含家电的开启、关闭例如:空调开启制冷、热水器开始加热或家电状态的切换或如空调制冷模式切换到制热模式,设定温度改变。

在本实施方式中,筛选提取所述存储的用户历史行为数据,包括:判断所述的用户行为数据是否有异常数据,所述异常数据包括用户对家电设备的异常操作数据,以及家电设备的异常状态数据,筛选提取去除明显异常后的用户行为数据。

如图3所示,为应用预测方法的一种基于lstm的智能家电用户行为的预测装置,至少包括:采集并储存用户家电使用的行为数据的数据采集存储单元;筛选并提取所述储存用户家电使用的行为数据行为数的提取单元;对所述的行为数据进行预处理,得到训练集和测试集的预处理单元;将所述训练集输入长短期记忆网络lstm模型训练数据,得到训练后模型的模型训练单元;将所述测试集输入所述训练后的模型得到预测数据的预测输出单元。

作为优选的实施方式,预处理单元具体用于:将所述训练数据进行转换处理,得到转换处理后的训练数据;对所述转换处理的训练数据进行归一化操作,得到归一化后的训练数据;对所述归一化的训练数据进行切分,得到所述训练集、验证集和测试集。

作为优选的实施方式,利用所述训练集训练lstm模型,利用验证集选择模型超参数,得到训练后的模型。更进一步的,预测输出单元用于:将所述测试集输入所述的训练好的用户行为预测模型,得到所述的预测行为数据。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本申请中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1