1.本发明涉及数据传输技术领域,具体涉及基于物联网技术的智慧小蚕共育室数据传输方法。
背景技术:2.自古以来我们就有养蚕缫丝的传统文化,育蚕的关键是有适合小蚕生存的环境条件,这些环境条件包括但不限于温湿度,传统控制育蚕室温湿度的方法是通过一些人工手段对育蚕室的湿度进行调节,例如采用地火笼或煤砖炉提升温度,通过人工洒水提高湿度,但是这种方法过于依靠人的主观想法和养育经验,不能够准确的控制育蚕室的温湿度情况。现有技术通常采用温度传感器采集相应的温度数据,并将所采集到的温度数据基于物联网技术通过通信网络系统传输到接收端,进一步对共育室温度进行调节。
3.发明人在实践中,发现上述现有技术存在以下缺陷:现有技术中将所采集到的温度数据基于物联网技术通过通信网络系统传输到接收端,而基于物联网技术的通信网络容易收到外来干扰和网络波动的影响,且所采集到的小蚕共育室数据为离散数据,虽然离散数据对应的数据曲线在趋势上能够反映温度数据的真实特征,但是由于小蚕共育室温度数据本身具有的波动性且存在噪声影响,使得所采集到的温度数据相比于小蚕共育室温度真实数据来说数据失真严重,因此现有技术中基于物联网技术的智慧小蚕共育室数据传输方法存在数据失真严重问题。
技术实现要素:4.为了解决现有技术中基于物联网技术的智慧小蚕共育室数据传输方法数据失真严重的技术问题,本发明的目的在于提供一种基于物联网技术的智慧小蚕共育室数据传输方法,所采用的技术方案具体如下:本发明提出了基于物联网技术的智慧小蚕共育室数据传输方法,所述方法包括:根据预设采样频率采集预设时间长度内的小蚕共育室的温度数据,根据温度数据拟合温度变化曲线;根据温度变化曲线中温度数据的斜率变化得到两个以上数据波动幅度值,根据数据波动幅度值的分布差异对数据波动幅度值进行聚类分析得到两个以上波动幅度值分割序列;根据每个波动幅度值分割序列中波动幅度值的空间分布得到修正概率,根据修正概率对所有波动幅度值分割序列进行去噪得到修正波动幅度值分割序列,根据修正波动幅度值序列对温度变化曲线进行修正,获得修正温度变化曲线;将修正温度变化曲线通过旋转门压缩法进行拟合得到修正后的温度数据,将修正后的温度数据存储到接收端完成数据传输。
5.进一步地,所述根据温度变化曲线中温度数据的斜率变化得到两个以上数据波动幅度值包括:
在温度变化曲线中,将目标温度数据对应的幅值与前一个温度数据的幅度值差异与时间差的比值作为目标温度数据的斜率;当目标温度数据的前一个温度数据的斜率为正值且后一个温度数据的斜率为负值时,将目标温度数据记为峰值点数据;当目标温度数据的前一个温度数据的斜率为负值且后一个温度数据的斜率为正值时,将目标温度数据记为谷值点数据;改变目标温度数据得到所有峰值点数据和谷值点数据,将相邻的峰值点和谷值点数据为一组计算峰值点和谷值点数据对应的幅度值差异,记为数据波动幅度值,根据所有的峰值点和谷值点得到两个以上数据波动幅度值。
6.进一步地,所述根据数据波动幅度值的分布差异对数据波动幅度值进行聚类分析得到两个以上波动幅度值分割序列包括:通过k-means聚类算法迭代选取k值得到最佳聚类效果,根据k-means聚类算法选取最佳聚类效果的k值对数据波动幅度值进行聚类分析得到两个以上波动幅度值分割序列;k为正整数且至少等于3。
7.进一步地,所述最佳聚类效果的k值的获取方法包括:对预设初始k值进行预设步长的迭代,计算初始k值和每次迭代后k值对应的聚类效果值,计算聚类效果值的过程包括:通过目标k值进行聚类分析得到的k个波动幅度值分割序列,统计每个波动幅度值分割序列中波动幅度值的数量并记为波动幅度值分割序列数据量,计算每个波动幅度值分割序列中波动幅度值的均方差;计算每个波动幅度值分割序列的均方差与波动幅度值分割序列数据量进行负相关归一化的值之和,并记为波动幅度值分割序列特征值,计算目标k值对应的所有波动幅度值分割序列特征值的累加值,记为目标k值对应的聚类效果值;改变目标k值得到所有k值对应的聚类效果值,选取聚类效果值的最小值对应的k作为最佳聚类效果的k值。
8.进一步地,所述修正概率的获取方法包括:将波动幅度值分割序列中所有峰值点数据依次排列,计算所有相邻峰值点对应的时间之间的差值得到峰值时间差值序列,根据峰值时间差值序列的数据分布计算每个波动幅度值分割序列的修正概率。
9.进一步地,所述根据峰值时间差值序列的数据分布计算每个波动幅度值分割序列的修正概率包括:将目标波动幅度值分割序列对应的峰值时间差值中相同数据作为一个数据类型,统计峰值时间差值序列中每个峰值时间差值对应的数据类型的数量和每个数据类型数据量,将数据类型数据量和峰值时间差值序列中数据总量的差值记为数据类型概率值,计算峰值时间差值序列中所有数据类型对应数据类型概率的分布熵,将分布熵进行负相关归一化得到目标波动幅度值分割序列对应的真实度修正系数;计算目标波动幅度值分割序列与所有波动幅度值分割序列中数据数量的数量占比,将数量占比与真实度修正系数的乘积记为目标波动幅度值分割序列的修正概率;改变目标波动幅度值分割序列得到每个波动幅度值分割序列的修正概率。
10.进一步地,所述根据修正概率对所有波动幅度值分割序列进行去噪得到修正波动幅度值分割序列包括:
计算所有波动幅度值分割序列中数据数量与波动幅度值分割序列数量的比值得到平均波动幅度值数量,将波动幅度值分割序列进行依次排列,将前a个波动幅度值分割序列对应的修正概率累加值与平均波动幅度值数量的乘积进行四舍五入取整,得到第a个波动幅度值分割序列对应的修正映射值,依次计算所有波动幅度值分割序列对应的修正映射值,其中a为正整数且a小于等于波动幅度值分割序列的数量;当目标波动幅度值分割序列的修正映射值等于其前一个波动幅度值分割序列的修正映射值时,将目标波动幅度值分割序列对应的数据记为噪声数据,筛选噪声数据得到修正波动幅度值分割序列。
11.本发明具有如下有益效果:考虑到所采集到的小蚕共育室的失真数据为离散数据,该离散数据在温度数据曲线上表现为连续曲折的线段,对应的个体数据的数值特征变化明显,如果按照温度数据曲线所反映的数据实时调节小蚕共育室温度条件,即高频率的调整小蚕共育室的温度条件,会严重影响小蚕的生存状况。本发明将连续曲折的线段对应的数据波动幅度值作为基础数据进行聚类分析,对聚类分析得到的波动赋值分割序列进行去噪得到修正温度变化曲线,进一步通过旋转门压缩法对修正温度变化曲线进行拟合得到修正后的温度数据,该修正后温度数据相比于原本的温度数据变化曲线来说,曲折和波动性较小,更能反映小蚕共育室的整体温度特征。而且该方法在不影响环境温度真实变化的情况下消除噪声影响,最大限度的消除了数据传输过程中的数据失真问题。此外,由于现有技术将历史数据中的温度数据储存在接收端,随着时间的累积,接收端的储存压力会不断增大,本发明通过对修正后的温度数据采用旋转门压缩法将温度数据储存至接收端,在保证数据传输真实性的同时最大限度的提高了单次压缩拟合的长度,使得压缩率提高。因此,本发明在提高压缩率的同时保证了传输数据的真实性。
附图说明
12.为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
13.图1为本发明一个实施例所提供的一种基于物联网技术的智慧小蚕共育室数据传输方法。
具体实施方式
14.为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于物联网技术的智慧小蚕共育室数据传输方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
15.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
16.下面结合附图具体的说明本发明所提供的一种基于物联网技术的智慧小蚕共育室数据传输方法的具体方案。
17.请参阅图1,其示出了本发明一个实施例提供的基于物联网技术的智慧小蚕共育室数据传输方法流程图,该方法包括:步骤s1:根据预设采样频率采集预设时间长度内的小蚕共育室的温度数据,根据温度数据拟合温度变化曲线。
18.本发明目的是将共育室温度数据传输至接收端储存的同时根据温度数据自适应调节共育室温度,但是所采集到的温度数据由于是离散数据,导致部分数据的个体数据特征明显,进而影响整体数据的温度变化趋势,结合受到噪声数据的影响使得所采集到的数据失真较为严重,因此本发明首先需要解决数据失真严重的问题。首先需要采集共育室环境特征数据,根据所需要采集的数据选择相应的传感器并通过预设采样频率采集预设时间长度内的小蚕共育室的环境特征数据。在本发明实施例中,根据预设采样频率采集预设时间长度内的小蚕共育室的温度数据,且预设采样频率设置每秒一次,预设采集时间长度设置为30分钟。需要说明的是,对于不同的环境特征数据,后续的分析处理方式均相同,本发明仅对温度数据进行分析。
19.在采集到预设时间长度内小蚕共育室温度数据后,根据所采集到的离散数据拟合温度变化曲线。但是由于数据失真严重,将该温度变化曲线对应的数据直接传输到接收端会由于数据过于驳杂导致接收端压缩率降低。此外,由于小蚕共育室的温度的调节是需要一定时间的,并非能够实时调节的数据,所以根据温度变化曲线对应的每个数据进行调节不够现实。因此本发明通过分析温度变化曲线的趋势和特征对温度变化曲线进行修正,得到能够准确反映小蚕共育室温度变化趋势的修正温度变化曲线,进一步根据修正温度变化曲线调节小蚕共育室的温度。
20.在得到修正温度变化曲线之后,对修正温度变化曲线内数据采用旋转门压缩法进行压缩储存。因为旋转门压缩法能够将得到数据的整体趋势,且温度数据作为持续、扩散的调节参数,其整体数据的信息量和真实度远高于个体数据,而旋转门压缩法能够很好的抑制个体数据的数值特征。另一方面,旋转门压缩法能够最大限度保留数据特征的同时增加数据压缩率,能够明显降低接收端数据储存的压力。需要说明的是,旋转门压缩法具体为:选择起始点,设置预设容差,将起始点上、下分别距离预设容差大小的位置处记为两个支点,建立两个门,门的长度可延伸,初始一个点时门闭合,随着数据增加,门逐渐打开,直到两扇门平行或内角和大于180
°
,将最后一个数据即为截止点。采用旋转门压缩法可以使得通过旋转门压缩法得到的每段数据均被两条平行的直线包围,进一步将每段数据对应的起始点和截止点之间的直线代替对应数据段中的所有数据。
21.步骤s2:根据温度变化曲线中温度数据的斜率变化得到两个以上数据波动幅度值,根据数据波动幅度值的分布差异对数据波动幅度值进行聚类分析得到两个以上波动幅度值分割序列。
22.至此,通过步骤s1得到小蚕共育室的温度变化曲线,由于传感器内敏感元件材料弹性疲劳、电压波动、元件老化、半导体元件参数变化等原因以及噪声影响,造成所采集到的温度变化曲线在直观上呈现微小的锯齿状而不是平滑的曲线,即温度变化曲线的波动性较大,不能够代表准确实际的温度变化特征。因此,为了得到能够表温度变化特征的曲线,
本发明对温度变化曲线的波动性进行分析,筛选出与小蚕共育室温度变化有关的温度数据作为真实温度数据。
23.首先根据温度变化曲线中温度数据的斜率变化得到两个以上数据波动幅度值,具体的:根据温度变化曲线中各个温度数据的斜率得到峰值点和谷值点,以相邻的峰值点与谷值点为一组,对所有峰值点和谷值点进行遍历,计算相邻峰值点与谷值点之间温度数据值的差异并记为数据波动幅度值,该数据波动幅值能够清楚的表现个体数据在整体温度数据中的变化情况。需要说明的是,由于峰值点和谷值点是根据温度变化曲线得到的,在时序上必然表现为峰值点与谷值点交叉分布,且当峰值点个谷值点的数量为奇数个时,将最后一个峰值点或谷值点舍弃。
24.优选地,在温度变化曲线中,将目标温度数据对应的幅值与前一个温度数据的幅度值差异与时间差的比值作为目标温度数据的斜率;当目标温度数据的前一个温度数据的斜率为正值且后一个温度数据的斜率为负值时,将目标温度数据记为峰值点数据;当目标温度数据的前一个温度数据的斜率为负值且后一个温度数据的斜率为正值时,将目标温度数据记为谷值点数据;改变目标温度数据得到所有峰值点数据和谷值点数据,将相邻的峰值点和谷值点数据为一组计算峰值点和谷值点数据对应的幅度值差异,记为数据波动幅度值,根据所有的峰值点和谷值点得到两个以上数据波动幅度值。
25.考虑到后续需要对温度数据通过旋转门压缩法进行压缩储存,但是旋转门压缩法会由于噪声波动和温度变化时产生的波动而截止,从而产生多段由旋转门算法产生的数据段,进一步导致压缩率大幅下降。因此为了能够使得后续的旋转门压缩法的压缩效率更高,本发明对数据波动幅度值进行聚类分析。
26.考虑到温度数据所受到外部影响的不同会使得所采集到数据波动幅度值分布情况不同,即由于传感器本身的影响所造成数据误差产生的数据波动、实际温度变化是产生的数据波动以及噪声产生的数据波动,三种影响温度数据的原因对应的数据波动幅度值分布情况不同。所以需要进一步对不同的数据波动幅度值进行分类。
27.根据数据波动幅度值的分布差异对数据波动幅度值进行聚类分析得到两个以上波动幅度值分割序列。具体的:统计所有的数据波动幅度值组成数据波动幅度值序列,对数据波动幅度值序列内数据波动幅度值通过k-means聚类算法进行聚类分析,根据最佳聚类效果的k值对数据波动幅度值序列内数据波动幅度值进行聚类分析,得到两个以上波动幅度值分割序列。优选地,通过k-means聚类算法迭代选取k值得到最佳聚类效果,根据k-means聚类算法选取最佳聚类效果的k值对数据波动幅度值进行聚类分析得到两个以上波动幅度值分割序列;k为正整数且至少等于3。
28.得到最佳聚类效果的k值的过程为:对预设初始k值进行预设步长的迭代,计算初始k值和每次迭代后k值对应的聚类效果值,计算聚类效果值的过程包括:通过目标k值进行聚类分析得到的k个波动幅度值分割序列,统计每个波动幅度值分割序列中波动幅度值的数量并记为波动幅度值分割序列数据量,计算每个波动幅度值分割序列中波动幅度值的均方差;计算每个波动幅度值分割序列的均方差与波动幅度值分割序列数据量进行负相关归一化的值之和,并记为波动幅度值分割序列特征值,计算目标k值对应的所有波动幅度值分割序列特征值的累加值,记为目标k值对应的聚类效果值;改变目标k值得到所有k值对应的聚类效果值,选取聚类效果值的最小值对应的k作为最佳聚类效果的k值。
29.聚类效果值的计算过程在公式上表现为:其中,为目标k值,为在目标k值情况下聚类分析得到的波动幅度值分割序列序号,为在目标k值情况下第个波动幅度值分割序列,为在目标k值情况下第个波动幅度值分割序列的均方差,为在目标k值情况下第个波动幅度值分割序列的数据量,为目标k值对应的聚类效果值,为自然常数。当采用k值对应的波动幅度值分割序列的均方差越小,每个波动幅度值分割序列中数据量越大,对应的聚类效果值越小。改变目标k值计算出所有迭代k值得到的聚类效果值,选取最小的聚类效果值作为最佳的聚类效果。
30.该聚类效果值的计算公式根据聚类分析得到的波动幅度值分割序列内数据的分布情况表征聚类效果,但是仅采用波动幅度值分割序列内数据的分布情况表征聚类效果,会造成当k值等于温度数据总量时,对应的聚类效果最好,即每个波动幅度值分割序列内仅有一个数据。所以为避免这种情况的发生,本发明引入每个波动幅度值分割序列的数量对该情况进行限制,使得所得到的最佳聚类效果在使得每个波动幅度值分割序列数据量足够的同时尽可能保证每个波动幅度值分割序列内数据足够相似。
31.步骤s3:根据每个波动幅度值分割序列中波动幅度值的空间分布得到修正概率,根据修正概率对所有波动幅度值分割序列进行去噪得到修正波动幅度值分割序列,根据修正波动幅度值序列对温度变化曲线进行修正,获得修正温度变化曲线。
32.至此,通过步骤s2得到两个以上波动幅度值分割序列,该波动幅度值序列有效的消除了由于传感器本身的影响所造成数据误差产生的数据波动,但是实际温度变化是产生的数据波动和噪声产生的数据波动影响在数值上无法区分,因此需要进一步排除噪声数据的影响。
33.为了排除噪声数据的影响,首选需要选取能够区分噪声数据和实际温度变化数据的区别。考虑到噪声数据作为偶然产生的数据,相比于实际温度变化数据来说更少,在时序温度数据序列上表现为:实际温度变化数据在短时间内持续出现,噪声数据在整体时序温度数据序列中随机分布。因此本发明根据每个波动幅度值分割序列内波动幅度值之间在温度变化曲线之间间距差异的分布状况,筛选出噪声数据。
34.首先根据每个波动幅度值分割序列中波动幅度值的空间分布得到修正概率,具体的:将目标波动幅度值分割序列对应的峰值时间差值中相同数据作为一个数据类型,统计峰值时间差值序列中每个峰值时间差值对应的数据类型的数量和每个数据类型数据量,将数据类型数据量和峰值时间差值序列中数据总量的差值记为数据类型概率值,计算峰值时间差值序列中所有数据类型对应数据类型概率的分布熵,将分布熵进行负相关归一化得到目标波动幅度值分割序列对应的真实度修正系数;计算目标波动幅度值分割序列与所有波动幅度值分割序列中数据数量的数量占比,将数量占比与真实度修正系数的乘积记为目标波动幅度值分割序列的修正概率;改变目标波动幅度值分割序列得到每个波动幅度值分割序列的修正概率。修正概率的计算过程在公式上表现为:
其中,为第个波动幅度值分割序列的修正概率,为第个波动幅度值分割序列内数据的数据量,为温度变化曲线中温度数据的总数,为峰值时间差值序列第个数据类型的数据量,为峰值时间差值序列中数据类型的数量,为峰值时间差值序列中数据类型的序号,为自然常数。为峰值时间差值序列中数据类型概率的分布熵,表征数据的混乱程度,表征波动幅度值分割序列中数据数量站所有数据总数的占比,对应的当波动幅度值分割序列内数据量越小,数据分布越混乱,对应的波动幅度值分割序列的修正概率越小。
35.修正概率的计算公式结合了噪声数据和实际温度变化数据的区别得到每个波动幅度值分割序列的修正概率。由于噪声数据为随机离散分布,在同一个波动幅度值分割序列中,噪声数据在温度数据拟合温度变化曲线中间距也是随机的,因此对应的分布熵较大;对于实际温度变化数据,由于实际温度变化数据在时序温度数据序列上短时间内持续出现,在同一个波动幅度值分割序列中对应的温度数据在温度数据拟合温度变化曲线中间距均分布,对应的分布熵较小。此外,通过引入波动幅度值分割序列中数据数量站所有数据总数的占比得到的修正概率能够表现出波动幅度值分割序列中数据量占总数据量经过修正后的修正概率值。
36.进一步根据修正概率对所有波动幅度值分割序列进行去噪得到修正波动幅度值分割序列,具体的:根据每个波动分割序列的修正概率和每个波动幅度值分割序列内数据对应的平均数据量得到每个波动幅度值分割序列的修正映射值,即修正后每个波动幅度值分割序列的数据量,当波动幅度值分割序列数据量的数据中大于修正映射值时对数据进行筛选,筛选出的数据即为噪声数据。
37.优选地,计算所有波动幅度值分割序列中数据数量与波动幅度值分割序列数量的比值得到平均波动幅度值数量,将波动幅度值分割序列进行依次排列,将前a个波动幅度值分割序列对应的修正概率累加值与平均波动幅度值数量的乘积进行四舍五入取整,得到第a个波动幅度值分割序列对应的修正映射值,依次计算所有波动幅度值分割序列对应的修正映射值,其中a为正整数且a小于等于波动幅度值分割序列的数量;当目标波动幅度值分割序列的修正映射值等于其前一个波动幅度值分割序列的修正映射值时,将目标波动幅度值分割序列对应的数据记为噪声数据,筛选噪声数据得到修正波动幅度值分割序列。筛选噪声数据的过程在公式上表现为:其中为累加至第个波动幅度值分割序列的映射值,为第个波动幅度值分割序列的修正概率值,为温度变化曲线中温度数据的总数,为波动幅度值分割序列的数量。该公式通过累加可以得到每次累加后波动幅度值分割序列对应的特征值,当对应的修正映射值变化不大时,认为该次累加对应的波动幅度值分割序列为噪声数据,将
噪声数据对应的波动幅度值进行消除。根据修正波动幅度值序列对温度变化曲线进行修正,获得修正温度变化曲线,具体修正过程为:忽略温度变化曲线上噪声数据对应的支点,直接拟合下一个数据支点。
38.步骤s4:将修正温度变化曲线通过旋转门压缩法进行拟合得到修正后的温度数据,将修正后的温度数据存储到接收端完成数据传输。
39.至此,通过步骤s3得到修正后的修正温度变化曲线。进一步将修正温度变化曲线压缩存储至接收端即可完成数据传输。考虑到旋转门压缩法利用拟合后的趋势进行温度控制,对应的反馈速度快,真实度高,且在保证压缩率的前提下更不容易出现数据失真。因此将修正温度变化曲线压缩存储至接收端具体的:对修正温度变化曲线通过旋转门压缩法进行拟合得到修正后的温度数据,将修正后的温度数据存储到接收端完成数据传输。
40.综上所述,本发明通过对温度变化曲线的斜率变化得到数据波动幅度值,根据数据波动值选取最佳聚类效果的k值对数据波动幅度值采用k-means聚类算法进行分类得到波动幅度值分割序列,根据波动幅度值分割序列中数据的空间分布特征筛选出噪声数据得到修正温度变化曲线,对修正温度变化曲线中数据通过旋转门压缩法压缩储存到接收端完成数据传输。本发明在在提高压缩率的同时保证了传输数据的真实性。
41.需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
42.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。