用于天气测量系统的数据高效存储方法与流程

文档序号:37582522发布日期:2024-04-18 12:06阅读:24来源:国知局
用于天气测量系统的数据高效存储方法与流程

本发明一般地涉及数据编码。更具体地,本发明涉及用于天气测量系统的数据高效存储方法。


背景技术:

1、天气测量系统包含了温度、湿度、气压、风速等大量的气象数据,为确保存储效率,需要对天气测量系统的气象数据进行压缩存储。

2、由于在不同时刻下,气象数据可能具有较大的差异,因此气象数据的重复率难以保证,而现有的压缩算法,如霍夫曼编码、算术编码等对于重复率大的数据能够达到较高的压缩效率,对于重复率小的数据的压缩效率较差,因此利用霍夫曼编码、算术编码等现有的压缩算法对气象数据进行编码压缩难以达到较好的压缩效果,从而导致气象数据存储效率低。


技术实现思路

1、为解决上述一个或多个技术问题,本发明提出用于天气测量系统的数据高效存储方法,该方法包括以下步骤:

2、采集气象数据;将每个时刻的气象数据映射到直角坐标系中,得到气象数据点;

3、将直角坐标系中的气象数据点转换到霍夫空间,得到霍夫空间中的多个高亮点;

4、根据霍夫空间中高亮点在直角坐标系中对应的直线上气象数据点的分布以及高亮点的坐标,确定高亮点之间的距离度量方法;根据预设的目标类簇数对霍夫空间中的高亮点进行聚类,得到目标类簇数对应的聚类结果,在聚类的每次迭代过程中,利用所述距离度量方法获取高亮点与聚类中心之间的距离,根据高亮点与聚类中心之间的距离确定类簇,利用所述距离度量方法获取类簇中高亮点之间的距离,根据类簇中高亮点的亮度以及高亮点之间的距离,确定新的聚类中心;

5、通过比较不同类簇数对应的聚类结果,筛选显著类簇数;根据显著类簇数对应的聚类结果对气象数据点进行编码,得到码字序列以及补充数据;对码字序列进行压缩得到压缩数据;

6、对压缩数据以及补充数据进行存储。

7、优选的,所述高亮点之间的距离度量方法,包括:

8、根据霍夫空间中高亮点在直角坐标系中对应的直线上气象数据点,获取霍夫空间中两个高亮点在直角坐标系中对应的直线上气象数据点之间的分布离散性;根据所述分布离散性以及高亮点的坐标,构建高亮点之间的距离度量公式:

9、

10、式中,i、j表示霍夫空间中高亮点的序号,且ij,表示霍夫空间中第i个高亮点与第j个高亮点之间的距离;表示第i个高亮点在霍夫空间中的横坐标,即第i个高亮点在直角坐标系中对应的直线到直角坐标系原点的距离;表示第j个高亮点在霍夫空间中的横坐标,即第j个高亮点在直角坐标系中对应的直线到直角坐标系原点的距离;表示霍夫空间中所有高亮点的横坐标构成的集合;表示第i个高亮点在霍夫空间中的纵坐标,即第i个高亮点在直角坐标系中对应的直线与直角坐标系x轴的夹角;表示第j个高亮点在霍夫空间中的纵坐标,即第j个高亮点在直角坐标系中对应的直线与直角坐标系x轴的夹角;表示第i个高亮点在直角坐标系中对应的直线上气象数据点,与第j个高亮点在直角坐标系中对应的直线上气象数据点之间的分布离散性;max( )表示最大值函数;min( )表示最小值函数;表示绝对值函数。

11、优选的,所述分布离散性满足关系式:

12、

13、式中,i、j表示霍夫空间中高亮点的序号,且ij,表示第i个高亮点在直角坐标系中对应的直线上气象数据点,与第j个高亮点在直角坐标系中对应的直线上气象数据点之间的分布离散性;表示第i个高亮点在直角坐标系中对应的直线上所有气象数据点的时刻构成的集合;表示第j个高亮点在直角坐标系中对应的直线上所有气象数据点的时刻构成的集合;表示并集符号,表示集合和的并集;( )表示方差函数,表示集合中所有元素的方差;表示集合中所有元素的方差;表示集合和的并集中所有元素的方差;为集合中所有元素的均值;为集合中所有元素的均值;表示第i个高亮点在直角坐标系中对应的直线与第j个高亮点在直角坐标系中对应的直线之间的交点所对应的时刻;表示集合和的并集中最大时刻与最小时刻的差值。

14、优选的,所述确定新的聚类中心,包括:

15、对于类簇中的每个高亮点,根据类簇中所有高亮点的亮度以及该高亮点与其余高亮点之间的距离获取该高亮点作为聚类中心的优异度;在类簇中筛选作为聚类中心的优异度最大的高亮点,作为新的聚类中心。

16、优选的,所述高亮点作为聚类中心的优异度满足关系式:

17、

18、其中,k表示类簇的序号,s、m表示类簇中高亮点的序号,且ms,表示第k个类簇中第s个高亮点作为聚类中心的优异度;表示第k个类簇中第m个高亮点的亮度;表示第k个类簇中第s个高亮点与第m个高亮点之间的距离;表示第k个类簇中包含的高亮点的数量。

19、优选的,所述筛选显著类簇数,包括:

20、根据每个类簇数对应的聚类结果获取每个类簇数的拟合优势;确定拟合优势最大的类簇数为显著类簇数。

21、优选的,拟合优势满足关系式:

22、

23、其中,表示目标类簇数的拟合优势;表示目标类簇数;k表示类簇的序号;表示目标类簇数对应的聚类结果中第k个类簇的聚类中心作为聚类中心的优异度;tanh( )表示双曲正切函数。

24、优选的,所述根据显著类簇数对应的聚类结果对气象数据点进行编码,得到码字序列以及补充数据,包括:

25、对各个类簇进行编号,记录显著类簇数对应的聚类结果中各个类簇的聚类中心,将各个类簇的聚类中心在霍夫空间中的坐标,按照类簇的编号从小到大的顺序构成一个序列,作为补充数据;

26、将各个类簇的编号作为各个类簇中所有高亮点在直角坐标系中对应的直线上的气象数据点的码字;将所有气象数据点的码字构成的序列作为码字序列。

27、本发明具有以下有益效果:

28、本发明根据霍夫空间中高亮点的聚类结果对气象数据进行编码,实现了将大量重复率较差的气象数据利用有限数量种不同的码字进行表示,提升了得到的码字序列的重复率,使得后续对码字序列进行压缩的压缩效率进一步提升,节省了天气测量系统的气象数据的存储空间,实现了高效存储。

29、进一步地,本发明通过对高亮点进行聚类,对类簇中所有高亮点在直角坐标系中对应的直线上的气象数据点进行统一编码,实现了将类簇中所有高亮点在直角坐标系中对应的直线上的气象数据点利用一条拟合直线来表示,通过聚类,确保了类簇中高亮点相似,即确保了高亮点在直角坐标系中对应的直线之间的相似性,使得此些直线上的气象数据点利用同一条拟合直线拟合时的拟合误差小,从而在实现了气象数据高效存储的同时确保了气象数据的损失小。

30、进一步地,本发明根据霍夫空间中高亮点在直角坐标系中对应的直线上气象数据点的分布以及高亮点的坐标,确定高亮点之间的距离度量方法,利用距离度量方法获取高亮点与聚类中心之间的距离,根据高亮点与聚类中心之间的距离确定类簇,利用距离度量方法获取类簇中高亮点之间的距离,根据类簇中高亮点的亮度以及高亮点之间的距离,确定新的聚类中心,使得聚类结果更加准确,进一步减小了各类簇中高亮点在直角坐标系中对应的直线上的气象数据点的拟合误差,从而在实现了气象数据高效存储的同时使得气象数据的损失进一步减小。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1