本技术涉及时空数据挖掘,特别涉及一种物联感知信息的多层次抽取方法及相关设备。
背景技术:
1、知识图谱是一种结构化的语义知识库,它通过图的形式存储实体之间的关系,使得信息的组织和检索更加直观和高效。知识图谱在数据整合与分析、信息检索与推荐、知识问答与推理等多种场景发挥了重要应用价值。
2、物联感知数据在构建知识图谱中扮演着至关重要的角色,因为它为知识图谱提供了实时、动态的实体信息和关系数据,使得知识图谱能够反映现实世界的变化。例如,在智能城市领域,传感器收集的交通流量数据可以帮助知识图谱识别交通模式和拥堵情况,从而优化交通管理;在农业领域,土壤湿度和气候数据可以用于构建农作物生长模型,帮助农民做出更科学的灌溉决策;在医疗健康领域,穿戴设备收集的生理数据可以与患者的病历信息结合,构建个性化的健康管理知识图谱,辅助医生进行精准诊断和治疗;在工业制造中,机器设备的运行数据可以用于监控生产流程,识别潜在故障,从而提高生产效率和安全性。这些物联感知数据的整合与分析,不仅丰富了知识图谱的内容,也提升了其在各个领域的应用价值。
3、随着物联网的快速发展,大量传感器被部署,产生了海量、多源、异构的感知数据。这些数据蕴含着丰富的时空特征信息,是动态构建和持续更新知识图谱的宝贵数据源。然而,由于物联网数据质量参差不齐、格式复杂多样,给数据处理和信息抽取带来了巨大挑战。数据的非标准化、时空特征的复杂性、时空关联的难以捕捉,都成为了阻碍知识图谱构建的因素。为了应对这些挑战,亟需建立面向物联网数据多样性的信息抽取方法体系。通过引入数据质量监控、格式解析、映射规范等环节,对多源异构数据进行系统性的结构化分析和转换,才能有效提取其中蕴藏的复杂时空信息,用于支撑知识图谱的动态增量构建。只有解决了数据利用问题,物联网感知数据才能真正成为知识图谱构建的助推器,实现图谱的实时更新和动态演化,为各类应用提供及时、准确、全面的知识服务。
4、当前,物联感知数据蕴含信息的抽取相关研究工作主要集中在提高数据的利用效率、提取有意义的洞见以及支持决策过程。研究者们探索了从物联网数据中提取特征的关键任务。研究涉及了传统的统计技术以及基于机器学习的特征提取方法,并基于它们捕获相关信息、降低维度以及增强下游物联网分析任务的性能的能力进行了评估。整体而言,目前的物联感知数据抽取技术存在诸多瓶颈问题,主要包括设备的多样性和标准不一导致的互操作性问题、通信协议的碎片化增加了互操作性的复杂性、以及数据格式和语义差异阻碍了有效的通信和数据交换,导致抽取结果的质量差,所包含的信息不够丰富。由此可见,目前存在物联感知信息抽取的信息质量低的问题。
技术实现思路
1、本技术提供了一种物联感知信息的多层次抽取方法及相关设备,可以解决物联感知信息抽取的信息质量低的问题。
2、第一方面,本技术实施例提供了一种物联感知信息的多层次抽取方法,该多层次抽取方法包括:
3、获取目标物联网的物联感知数据,并构建用于描述目标物联网中传感器数据的属性的物联感知数据本体模型;物联感知数据包括多个传感器数据以及每个传感器数据的相关信息;
4、对物联感知数据进行数据增强,得到包括多个增强传感器数据的增强感知数据,并根据物联感知数据本体模型对增强感知数据进行浅层映射,得到每个增强传感器数据对应的属性三元组;属性三元组包括增强传感器数据、增强传感器数据对应的传感器、增强传感器数据的属性;
5、基于所有属性三元组进行深层特征提取,得到每个增强传感器数据的时空特征三元组;时空特征三元组包括增强传感器数据的空间信息、增强传感器数据的变化信息、增强传感器数据的时间信息;
6、对增强感知数据进行时空模式挖掘,得到多个时空关系三元组;时空关系三元组用于描述所有增强传感器数据在时空上的关联关系;
7、基于所有属性三元组、所有时空特征三元组和所有时空关系三元组构建目标物联网的知识图谱。
8、可选的,物联感知数据本体模型包括概念层、属性层;
9、概念层中包括与物联感知数据相关的多个实体,多个实体包括传感器数据;
10、属性层中包括每个实体的属性。
11、可选的,对物联感知数据进行数据增强,得到包括多个增强传感器数据的增强感知数据,包括:
12、对物联感知数据进行缺失数据识别,从所有传感器数据中识别出多个缺失数据;
13、分别针对每个缺失数据,若缺失数据的数据缺失比例大于缺失比例阈值,则将缺失数据丢弃,若缺失数据的数据缺失比例小于等于缺失比例阈值,则对缺失数据进行数据填充,得到完整数据;
14、对每个完整数据进行异常校正,得到每个完整数据对应的增强传感器数据;
15、对所有传感器数据中除缺失数据以外的每个其他传感器数据进行异常校正,得到每个其他传感器数据对应的增强传感器数据;
16、将所有增强传感器数据进行整合,得到增强感知数据。
17、可选的,根据物联感知数据本体模型对增强感知数据进行浅层映射,得到每个增强传感器数据对应的属性三元组,包括:
18、分别针对增强感知数据中的每个增强传感器数据,根据物联感知数据本体模型的属性层,从增强传感器数据对应的相关信息中识别出增强传感器数据的属性,将增强传感器数据、增强传感器数据对应的传感器、增强传感器数据的属性进行整合,得到属性三元组。
19、可选的,基于所有属性三元组进行深层特征提取,得到每个增强传感器数据的时空特征三元组,包括:
20、分别针对每个增强传感器数据,进行以下步骤:
21、对增强传感器数据进行深层特征提取,得到增强传感器数据的变化信息;
22、获取增强传感器数据的属性三元组中增强传感器数据对应的传感器的空间信息;
23、从增强传感器数据对应的相关信息中获取增强传感器数据的时间信息;
24、将增强传感器数据的变化信息、空间信息、时间信息进行整合,得到时空特征三元组。
25、可选的,对增强感知数据进行时空模式挖掘,得到多个时空关系三元组,包括:
26、构建包括多种时空关联模式的时空模式库;时空关联模式用于描述两个空间位置在时间和空间上的关联关系;
27、分别针对增强感知数据中的每两个增强传感器数据,进行以下步骤:
28、根据两个增强传感器数据对应的空间信息,从时空模式库中确定出两个增强传感器数据对应的空间信息之间的目标时空关联模式;
29、将两个增强传感器数据对应的空间信息、目标时空关联模式转换为时空关系三元组。
30、可选的,物联感知数据本体模型还包括关系层和实例层;
31、关系层中包括概念层中所有实体之间的多种实体关系;
32、实例层用于描述概念层中每个实体的具体实例。
33、第二方面,本技术实施例提供了一种物联感知信息的多层次抽取装置,包括:
34、获取模块,获取目标物联网的物联感知数据,并构建用于描述目标物联网中传感器数据的属性的物联感知数据本体模型;物联感知数据包括多个传感器数据以及每个传感器数据的相关信息;
35、浅层映射模块,对物联感知数据进行数据增强,得到包括多个增强传感器数据的增强感知数据,并根据物联感知数据本体模型对增强感知数据进行浅层映射,得到每个增强传感器数据对应的属性三元组;属性三元组包括增强传感器数据、增强传感器数据对应的传感器、增强传感器数据的属性;
36、深层特征提取模块,基于所有属性三元组进行深层特征提取,得到每个增强传感器数据的时空特征三元组;时空特征三元组包括增强传感器数据的空间信息、增强传感器数据的变化信息、增强传感器数据的时间信息;
37、时空模式挖掘模块,对增强感知数据进行时空模式挖掘,得到多个时空关系三元组;时空关系三元组用于描述所有增强传感器数据在时空上的关联关系;
38、构建模块,基于所有属性三元组、所有时空特征三元组和所有时空关系三元组构建目标物联网的知识图谱。
39、第三方面,本技术实施例提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,该处理器执行上述计算机程序时实现上述的物联感知信息的多层次抽取方法。
40、第四方面,本技术实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述的物联感知信息的多层次抽取方法。
41、本技术的上述方案有如下的有益效果:
42、在本技术的实施例中,通过获取目标物联网的物联感知数据,并构建用于描述目标物联网中传感器数据的属性的物联感知数据本体模型,然后对物联感知数据进行数据增强,得到包括多个增强传感器数据的增强感知数据,并根据物联感知数据本体模型对增强感知数据进行浅层映射,得到每个增强传感器数据对应的属性三元组,再基于所有属性三元组进行深层特征提取,得到每个增强传感器数据的时空特征三元组,然后对增强感知数据进行时空模式挖掘,得到多个时空关系三元组,最后基于所有属性三元组、所有时空特征三元组和所有时空关系三元组构建目标物联网的知识图谱。其中,对物联感知数据进行数据增强,能够提高物联感知数据的质量和准确性,基于质量高的数据进行浅层映射、深层特征提取、时空模式挖掘三种处理,能够提高信息抽取得到的信息质量,同时,得到三种包含不同信息的三元组,有效提高了信息抽取的信息丰富度。
43、本技术的其它有益效果将在随后的具体实施方式部分予以详细说明。