本发明涉及空间数据处理,尤其涉及一种空间数据聚类方法、系统、设备及介质。
背景技术:
1、空间聚类,又称空间分区,是地理学的一个传统研究课题。空间聚类揭示了聚类内部的共同过程和特征以及聚类之间的差异。新的聚类比原始空间对象具有更丰富的地理含义,使聚类成为进一步综合研究的基础。空间异常点的处理是空间聚类需要解决的关键问题。
2、空间聚类方法将具有相似属性的空间单元进分为同一个聚类,同时施加空间连续的约束。施加约束的方法有两种,严格约束或非严格约束。严格约束意味着同一聚类的空间单元必须在空间上是连续的。非严格约束不要求聚类的所有空间单元都是连续的,但只要求它们中的大多数是连续的。严格空间约束聚类方法会将一些非常相似但距离较远的空间单元划分为不同的类别,且会在一个聚类中包含一些相邻但不是非常相似的单元。
3、空间连续性和属性相似性由地理坐标或位置相异性的权重控制。若位置的权重太大,空间异常点将与邻近的空间单元聚为一类,从而导致该聚类的属性差异极大。如果位置的权重太小,虽然可以正确划分出空间异常点,但得到的聚类在空间上是分散的,空间连续性差。
技术实现思路
1、本发明提供一种空间数据聚类方法、系统、设备及介质,用以解决现有技术中空间数据聚类属性差异太大,空间连续性差的缺陷,实现对空间数据聚类的灵活处理,提高栅格空间数据聚类结果的属性相似性和空间连续性。
2、本发明提供一种空间数据聚类方法,包括:
3、获取待测地理空间的至少一个栅格单元;
4、基于各所述栅格单元的属性值,确定各所述栅格单元的初始类别;
5、基于滑动窗口遍历各所述栅格单元,基于所述滑动窗口内的各所述栅格单元的属性值,将所述滑动窗口内的各所述栅格单元划分为空间异常点和非空间异常点;
6、基于所述滑动窗口内的各所述栅格单元的属性值,更新各所述非空间异常点对应的栅格单元的类别;
7、所述更新各所述非空间异常点对应的栅格单元的类别,包括以下至少一项:
8、将所述滑动窗口内的各所述栅格单元的类别修改为第一目标类别,所述第一目标类别为所述滑动窗口内数量最多的所述栅格单元的初始类别;
9、将所述滑动窗口内的各所述栅格单元的类别修改为第二目标类别,所第二目标类别为所述滑动窗口内所有栅格单元的属性值的平均值所对应的所述初始类别。
10、根据本发明提供的一种空间数据聚类方法,所述基于所述滑动窗口内的各所述栅格单元的属性值,将所述滑动窗口内的各所述栅格单元划分为空间异常点和非空间异常点,包括:
11、获取所述滑动窗口内的各所述栅格单元的属性值极差;
12、在所述属性值极差大于第一预设阈值的情况下,判定所述滑动窗口内包括空间异常点;
13、在所述属性值极差小于或等于所述第一预设阈值的情况下,判定所述滑动窗口内的各所述栅格单元为所述非空间异常点。
14、根据本发明提供的一种空间数据聚类方法,所述在所述属性值极差大于第一预设阈值的情况下,判定所述滑动窗口内包括空间异常点,包括:
15、在所述滑动窗口内的各所述栅格单元的属性值的平均值大于各所述栅格单元的属性值的中位数值的情况下,划定所述滑动窗口内所述属性值最大的所述栅格单元为所述空间异常点;
16、在所述滑动窗口内的各所述栅格单元的属性值的平均值小于或等于各所述栅格单元的属性值的中位数值的情况下,划定所述滑动窗口内所述属性值最小的所述栅格单元为所述空间异常点。
17、根据本发明提供的一种空间数据聚类方法,所述在所述属性值极差大于第一预设阈值的情况下,判定所述滑动窗口内包括空间异常点之后,还包括:
18、移除所述滑动窗口内的所述空间异常点对应的所述栅格单元;
19、在所述滑动窗口内的剩余所述栅格单元的属性值标准差大于第二预设阈值的情况下,划定所述剩余所述栅格单元为空间异常点;
20、在所述滑动窗口内的所述剩余所述栅格单元的属性值标准差小于或等于所述第二预设阈值的情况下,划定所述剩余所述栅格单元为非空间异常点。
21、根据本发明提供的一种空间数据聚类方法,所述空间异常点对应的各所述栅格单元的类别为各所述栅格单元的初始类别。
22、根据本发明提供的一种空间数据聚类方法,所述基于滑动窗口遍历各所述栅格单元,包括:
23、所述滑动窗口在所述待测地理空间内从左至右和/或从上至下依次遍历所述待测地理空间内的各所述栅格单元,滑动步长为一个栅格。
24、根据本发明提供的一种空间数据聚类方法,所述滑动窗口为固定边长的正方形。
25、本发明还提供一种空间数据聚类系统,包括:
26、获取模块,用于获取待测地理空间的至少一个栅格单元;
27、类别确定模块,用于基于各所述栅格单元的属性值,确定各所述栅格单元的初始类别;
28、划分模块,用于基于滑动窗口遍历各所述栅格单元,基于所述滑动窗口内的各所述栅格单元的属性值,将所述滑动窗口内的各所述栅格单元划分为空间异常点和非空间异常点;
29、类别更新模块,用于基于所述滑动窗口内的各所述栅格单元的属性值,更新各所述非空间异常点对应的栅格单元的类别;
30、所述类别更新模块,具体用于:
31、将所述滑动窗口内的各所述栅格单元的类别修改为第一目标类别,所述第一目标类别为所述滑动窗口内数量最多的所述栅格单元的初始类别;
32、或,将所述滑动窗口内的各所述栅格单元的类别修改为第二目标类别,所第二目标类别为所述滑动窗口内所有栅格单元的属性值的平均值所对应的所述初始类别。
33、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的空间数据聚类方法。
34、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的空间数据聚类方法。
35、本发明提供的一种空间数据聚类方法、系统、设备及介质,对待测地理空间内的栅格单元基于属性值进行类别划分,通过滑动窗口遍历待测地理空间内的栅格单元,划分出空间异常点和非空间异常点,基于各栅格单元的属性值,对非空间异常点对应的栅格单元的类别进行更新,保留了空间异常点对应的栅格单元的属性值,通过更新非空间异常点对应的栅格单元的类别,提升了空间数据聚类的空间连续性。
1.一种空间数据聚类方法,其特征在于,包括:
2.根据权利要求1所述的空间数据聚类方法,其特征在于,所述基于所述滑动窗口内的各所述栅格单元的属性值,将所述滑动窗口内的各所述栅格单元划分为空间异常点和非空间异常点,包括:
3.根据权利要求2所述的空间数据聚类方法,其特征在于,所述在所述属性值极差大于第一预设阈值的情况下,判定所述滑动窗口内包括空间异常点,包括:
4.根据权利要求3所述的空间数据聚类方法,其特征在于,所述在所述属性值极差大于第一预设阈值的情况下,判定所述滑动窗口内包括空间异常点之后,还包括:
5.根据权利要求1所述的空间数据聚类方法,其特征在于,所述空间异常点对应的各所述栅格单元的类别为各所述栅格单元的初始类别。
6.根据权利要求1所述的空间数据聚类方法,其特征在于,所述基于滑动窗口遍历各所述栅格单元,包括:
7.根据权利要求1所述的空间数据聚类方法,其特征在于,所述滑动窗口为固定边长的正方形。
8.一种空间数据聚类系统,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的空间数据聚类方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的空间数据聚类方法。