一种基于城市大数据的道路障碍风险评估方法、装置及可读存储介质

文档序号:25218178发布日期:2021-05-28 14:17阅读:69来源:国知局
一种基于城市大数据的道路障碍风险评估方法、装置及可读存储介质

本发明涉及人工智能、大数据、城市计算领域,特别是指一种基于城市大数据的道路障碍风险评估方法、装置及可读存储介质。



背景技术:

道路障碍主要指妨碍道路正常通行通车的异常现象。无论是对于城市管理还是城市应急来说,道路障碍一直以来都困扰着各个城市。道路障碍给城市的正常运转带来许多不必要的麻烦,如交通问题、安全问题。同时,道路障碍也对群众造成困扰,影响群众的出行。

传统道路障碍检测主要依靠城市调查员的实地调查和摄像头查看的方式。该传统方法的缺陷在于调查过程造成大量时间成本和人力财力成本的消耗,且摄像头受限于天气和光线,更重要的是此类方法无法做到风险的预测。



技术实现要素:

本发明的主要目的在于克服现有技术中的上述缺陷,提出一种基于城市大数据的道路障碍风险评估方法,基于多源数据融合,具有高效、低耗的优点,同时也达到了较高的准确率。

本发明采用如下技术方案:

本发明实施例一方面提供一种基于城市大数据的道路障碍风险评估方法,包括如下步骤:

城市路网提取:根据经纬度划分成同样大小的网格,根据每个浮动车的gps坐标映射到对应的网格内,统计每个时间段各个网格浮动车的数量;将每个网格每个小时对应的浮动车数量进行聚类,提取出路网并且将路网分成相应路段;

路网特征提取:提取每个路网网格对应的时空和情境特征;时空特征为相应时间相应位置的天气特征,情境特征主要包括dem、树木覆盖率和poi特征;

道路障碍风险预测:通过社交网络数据,利用关键字,爬取特定字段,通过群智感知系统,由群智感知者进行录入,获取到最终发生道路障碍数据;通过统计各个时段浮动车的数量,设置阈值,获取各个时段各个路网网格无发生道路障碍事件数据;根据提取到的路网特征以及所对应的发生道路障碍和没有发生道路障碍的事件,基于self-training自训练模型的模型预测。

具体地,所述路网特征提取,提取每个路网网格对应的时空和情境特征;时空特征为相应时间相应位置的天气特征,情境特征主要包括dem、树木覆盖率和poi特征,具体为:

对于时空特征,通过undergroundweatherapi获取相应的天气特征;

对于情境特征,通过数字高程模型(dem)映射到每个路网网格,获取到dem特征,再通过每个路网网格城市遥感卫星图像,进行alexnet训练并分类,得到路网网格的树木覆盖率,最后将poi根据gps映射到各个路网网格中,并统计数量,作为poi特征。

具体地,所述通过统计各个时段浮动车的数量,设置阈值,获取各个时段各个路网网格无发生道路障碍事件数据,具体包括:

将浮动车按各个时间映射到各个路网当中;

设置阈值,大于阈值则认为所述时间段、所述路网网格无发生道路障碍事件,作为无发生道路障碍事件数据。

具体地,所述根据提取到的路网特征以及所对应的发生道路障碍和没有发生道路障碍的事件,基于self-training自训练模型的模型预测,具体包括:

根据提取到的路网特征以及所对应的发生道路障碍和没有发生道路障碍的事件;

合并所提取的路网特征以及事件数据,得到三个数据集,一个为发生道路障碍事件数据集,一个为无发生道路障碍数据集,一个为未知数据集。

将发生道路障碍事件数据集和无发生道路障碍数据集进行训练,得到一个分类器后,对未知数据集进行预测,取置信度最高的n个数据加入训练集中训练,直到模型最优,n为整数。

本发明实施例另一方面提供一种基于城市大数据的道路障碍风险评估装置,包括:

城市路网提取单元:根据经纬度划分成同样大小的网格,根据每个浮动车的gps坐标映射到对应的网格内,统计每个时间段各个网格浮动车的数量;将每个网格每个小时对应的浮动车数量进行聚类,提取出路网并且将路网分成相应路段;

路网特征提取单元:提取每个路网网格对应的时空和情境特征;时空特征为相应时间相应位置的天气特征,情境特征主要包括dem、树木覆盖率和poi特征;

道路障碍风险预测单元:通过微博等社交网络数据,利用关键字,爬取特定字段,通过群智感知系统,由群智感知者进行录入,获取到最终发生道路障碍数据;通过统计各个时段浮动车的数量,设置阈值,获取各个时段各个路网网格无发生道路障碍事件数据;根据提取到的路网特征以及所对应的发生道路障碍和没有发生道路障碍的事件,基于self-training自训练模型的模型预测。

具体地,所述路网特征提取单元中,提取每个路网网格对应的时空和情境特征;时空特征为相应时间相应位置的天气特征,情境特征主要包括dem、树木覆盖率和poi特征,具体包括:

对于时空特征,通过undergroundweatherapi获取相应的天气特征;

对于情境特征,通过数字高程模型(dem)映射到每个路网网格,获取到dem特征,再通过每个路网网格城市遥感卫星图像,进行alexnet训练并分类,得到路网网格的树木覆盖率,最后将poi根据gps映射到各个路网网格中,并统计数量,作为poi特征。

具体地,所述道路障碍风险预测单元中,通过统计各个时段浮动车的数量,设置阈值,获取各个时段各个路网网格无发生道路障碍事件数据,具体包括:

将浮动车按各个时间映射到各个路网当中;

设置阈值,大于阈值则认为所述时间段、所述路网网格无发生道路障碍事件,作为无发生道路障碍事件数据。

具体地,所述道路障碍风险预测单元中,根据提取到的路网特征以及所对应的发生道路障碍和没有发生道路障碍的事件,基于self-training自训练模型的模型预测,具体包括:

根据提取到的路网特征以及所对应的发生道路障碍和没有发生道路障碍的事件;

合并所提取的路网特征以及事件数据,得到三个数据集,一个为发生道路障碍事件数据集,一个为无发生道路障碍数据集,一个为未知数据集。

将发生道路障碍事件数据集和无发生道路障碍数据集进行训练,得到一个分类器后,对未知数据集进行预测,取置信度最高的n个数据加入训练集中训练,直到模型最优,n为整数。

本发明实施例再一方面提供一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于执行上述基于城市大数据的道路障碍风险评估方法。

由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:

(1)本发明提供一种基于城市大数据的道路障碍风险评估方法,统计每个时间段各个网格浮动车的数量;将每个网格每个小时对应的浮动车数量进行聚类,提取出路网并且将路网分成相应路段;提取每个路网网格对应的时空和情境特征,以及所对应的发生道路障碍和没有发生道路障碍的事件,最后采用self-training自训练神经网络模型对道路障碍风险进行预测,实现多源数据融合,具有高效、低耗的优点,同时也达到了较高的准确率。

(2)由于道路随着城市发展而变化,且道路不时会进行维护,各大地图的更新相对没那么快,导致城市路网的差错性;本发明利用浮动车数据,运用聚类算法进行路网的提取,运用及时的、近期的浮动车数据对城市路网进行相应路网的提取,较好地避免了上述问题。

附图说明

图1本发明实施例技术方案的整体流程框架图;

图2本发明实施例厦门岛网格图;

图3本发明实施例厦门路网图;

图4本发明实施例数字高程模型(dem)特征图;

图5本发明实施例的树木覆盖率图;

图6本发明实施例的群智感知获取事件数据图;其中图(a)为来自社交网络原始数据;图(b)为群智感知;图(c)为最终数据;

图7本发明实施例self-training方法的原理图。

以下结合附图和具体实施例对本发明作进一步详述。

具体实施方式

如图1是本发明实施例技术方案的整体流程框架图,其共分为三个阶段,一是对城市路网进行提取,二是对路网特征进行提取,三是进行道路障碍风险预测。城市路网提取基于城市网格,按网格时间划分,提取浮动车数据,进行聚类,得到城市道路;路网特征提取涉及异构数据融合技术,从遥感卫星图像、dem数据、城市天气、城市poi等异构数据中提取与道路障碍发生相关的特征信息;道路障碍风险评估基于群智感知技术提取相关事件,利用self-training自训练神经网络模型实现道路障碍风险的预测;

详述具体实施步骤为:

s1:城市路网提取:根据经纬度划分成同样大小的网格,根据每个浮动车的gps坐标映射到对应的网格内,统计每个时间段各个网格浮动车的数量;将每个网格每个小时对应的浮动车数量进行聚类,提取出路网并且将路网分成相应路段;

首先,从城市根据经纬度划分成同样大小的网格,如图2所示。接着,根据每个浮动车的gps坐标映射到对应的网格内,统计每个时间段各个网格浮动车的数量。最后,将每个网格每个小时对应的浮动车数量进行聚类,提取出路网并且将路网分成相应路段。如图3所示,分别包括非路网块a,每个时段所对应的浮动车车辆数几乎都为0,如象屿保税区路段;主路网块b,在清晨只有少量的浮动车,在其他时间则有大量的浮动车,如仙岳路路段;深夜路网块c,午夜时分有很多浮动车,如嘉禾路靠近明发广场路段,日常路网块d,如环岛干道靠近厦门高崎机场路段,只有航班降落时才有浮动车,无航班时几乎没有浮动车;通勤路网块e,在通勤时间有很多浮动车,如环岛干道靠近软件园二期路段;休息路网块f,在休息时间段有很多浮动车,如文兴东路路段。

获取相应城市的经纬度,以及相应地图底图,这里具体为厦门岛。

将城市根据经度和纬度分为nr(i×j)个网格块,这里具体采用了根据厦门岛经纬度([24.423250,118.064743]-[24.561485,118.198504]),将厦门岛分为154×136个网格块。

使用浮动车数据进行路网提取:

将浮动车数据按照时间段映射到各个网格块中,这里具体采用了厦门市出租车数据,将出租车数据根据24小时归类,映射到每一个网格块上,得到154×136个网格块都有24小时出租车数量数据。

采用python中sklearn库对以上每个网格块,根据24小时出租车数量进行聚类,聚成6类,其中有一类为非路网。

路网特征提取:提取每个路网网格对应的时空和情境特征;时空特征为相应时间相应位置的天气特征,情境特征主要包括dem、树木覆盖率和poi特征;

特征的提取为模型的训练做好铺垫,本阶段主要提取每个路网网格对应的时空和情境特征。时空特征主要为相应时间相应位置的天气特征,情境特征主要包括dem、树木覆盖率和poi特征。对于时空特征,通过undergroundweatherapi获取相应的天气特征。对于情境特征,首先通过数字高程模型(dem)映射到每个路网网格,获取到dem特征,如图4所示,接着通过每个路网网格城市遥感卫星图像,进行alexnet训练并分类,得到路网网格的树木覆盖率,如图5所示,最后将poi根据gps映射到各个路网网格中,并统计其数量,作为其poi特征。

s3:道路障碍风险预测:通过社交网络数据,利用关键字,爬取特定字段,通过群智感知系统,由群智感知者进行录入,获取到最终发生道路障碍数据;通过统计各个时段浮动车的数量,设置阈值,获取各个时段各个路网网格无发生道路障碍事件数据;根据提取到的路网特征以及所对应的发生道路障碍和没有发生道路障碍的事件,基于self-training自训练模型的模型预测。

通过微博等社交网络数据,爬取特定字段微博,如“内涝”、“树木倒伏”等,由于获取到的数据有些并非我们所需要的数据,如“内涝应急演练”,且获取到的数据没有对应的路网网格信息,因此我们将获取到的原始数据通过群智感知系统,由群智感知者进行录入,获取到最终需要的数据,如图6所示。

将浮动车按各个时间映射到各个路网当中;设置阈值,大于阈值则认为所述时间段、所述路网网格无发生道路障碍事件,作为无发生道路障碍事件数据。

根据提取到的路网特征以及所对应的发生道路障碍和没有发生道路障碍的事件,如图7所示;首先利用已知发生道路障碍和没有发生道路障碍的事件,融合城市多源特征,训练一个模型,得到一个分类器,再运用这个分类器将未知发生与否的数据进行预测,取置信度高的打上标签后加入训练集中参与训练,直到准确率达到某个值,跳出循环,得到最终的分类模型,具体为:

合并所提取的路网特征以及事件数据,得到三个数据集,一个为发生道路障碍事件数据集,一个为无发生道路障碍数据集,一个为未知数据集。

将发生道路障碍事件数据集和无发生道路障碍数据集进行训练,得到一个分类器后,对未知数据集进行预测,取置信度最高的10个数据加入训练集中训练,直到模型最优。

本发明实施例另一方面提供一种基于城市大数据的道路障碍风险评估装置,包括:

城市路网提取单元:根据经纬度划分成同样大小的网格,根据每个浮动车的gps坐标映射到对应的网格内,统计每个时间段各个网格浮动车的数量;将每个网格每个小时对应的浮动车数量进行聚类,提取出路网并且将路网分成相应路段;

路网特征提取单元:提取每个路网网格对应的时空和情境特征;时空特征为相应时间相应位置的天气特征,情境特征主要包括dem、树木覆盖率和poi特征;

道路障碍风险预测单元:通过微博等社交网络数据,利用关键字,爬取特定字段,通过群智感知系统,由群智感知者进行录入,获取到最终发生道路障碍数据;通过统计各个时段浮动车的数量,设置阈值,获取各个时段各个路网网格无发生道路障碍事件数据;根据提取到的路网特征以及所对应的发生道路障碍和没有发生道路障碍的事件,基于self-training自训练模型的模型预测。

具体地,所述路网特征提取单元中,提取每个路网网格对应的时空和情境特征;时空特征为相应时间相应位置的天气特征,情境特征主要包括dem、树木覆盖率和poi特征,具体包括:

对于时空特征,通过undergroundweatherapi获取相应的天气特征;

对于情境特征,通过数字高程模型(dem)映射到每个路网网格,获取到dem特征,再通过每个路网网格城市遥感卫星图像,进行alexnet训练并分类,得到路网网格的树木覆盖率,最后将poi根据gps映射到各个路网网格中,并统计数量,作为poi特征。

具体地,所述道路障碍风险预测单元中,通过统计各个时段浮动车的数量,设置阈值,获取各个时段各个路网网格无发生道路障碍事件数据,具体包括:

将浮动车按各个时间映射到各个路网当中;

设置阈值,大于阈值则认为所述时间段、所述路网网格无发生道路障碍事件,作为无发生道路障碍事件数据。

具体地,所述道路障碍风险预测单元中,根据提取到的路网特征以及所对应的发生道路障碍和没有发生道路障碍的事件,基于self-training自训练模型的模型预测,具体包括:

根据提取到的路网特征以及所对应的发生道路障碍和没有发生道路障碍的事件;

合并所提取的路网特征以及事件数据,得到三个数据集,一个为发生道路障碍事件数据集,一个为无发生道路障碍数据集,一个为未知数据集。

将发生道路障碍事件数据集和无发生道路障碍数据集进行训练,得到一个分类器后,对未知数据集进行预测,取置信度最高的n个数据加入训练集中训练,直到模型最优,n为整数。

本发明实施例再一方面提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于执行上述基于城市大数据的道路障碍风险评估方法。

计算机指令(也称作程序、软件、软件应用或代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算机指令。术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(programmablelogicdevice,pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。

上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1