本公开实施例涉及计算机技术技术领域,特别涉及轨迹分类模型的训练方法和装置、电子设备、计算机可读介质。
背景技术:
随着智能电子采集设备的快速发展,可利用智能手机、车载导航、gps等设备搜集到多种轨迹数据。而轨迹数据为智慧城市、交通规划、安排合理出行等方面上,提供了重要的解决思路。对轨迹数据地分析利用已是近些年来商业讨论的焦点。
在现有技术中,例如,通过摄像机捕捉的图像序列中分析和理解运动目标的行为,并对异常行为进行报警。行为检测是智能视觉监控的重要功能。基于轨迹数据的事件检测,能够长时间分析目标的行为,从而可以有效的预测和判断目标的行为,如构建4维直方图等。
技术实现要素:
本公开实施例提供一种轨迹分类模型的训练方法和装置、电子设备、计算机可读介质。
第一方面,本公开实施例提供了一种轨迹分类模型的训练方法,包括:
获取轨迹数据;
根据所述轨迹数据的时间特征和空间特征计算所述轨迹数据的轨迹特征,其中,所述轨迹特征包括曲率和/或转角;
对所述轨迹特征进行训练,得到轨迹分类模型。
在一些实施例中,在所述获取轨迹数据之后,还包括:
对所述轨迹数据进行预处理;
则所述根据所述轨迹数据的时间特征和空间特征计算所述轨迹数据的轨迹特征,包括:
根据预处理后的轨迹数据的时间特征和空间特征计算所述轨迹特征;
所述预处理包括:将满足至少一个条件的所述轨迹数据进行删除,得到所述预处理后的轨迹数据;
所述至少一个条件包括:
时间特征相同而空间特征不同;
空间特征超出预设区域范围的轨迹数据的数量小于预设比值。
在一些实施例中,还包括:
根据所述轨迹数据的时间特征计算所述轨迹数据的采样时间的时间间隔;
响应于各个时间间隔均相同,执行所述根据所述轨迹数据的时间特征和空间特征计算所述轨迹数据的轨迹特征。
在一些实施例中,响应于至少一个时间间隔不同,根据线性差值采样法以预设时间间隔进行重采样,得到重采样后的轨迹数据;
所述根据所述轨迹数据的时间特征和空间特征计算所述轨迹数据的轨迹特征包括:
根据所述重采样后的轨迹数据的时间特征和空间特征计算所述轨迹特征。
在一些实施例中,所述对所述轨迹特征进行训练,得到轨迹分类模型,包括:
将所述轨迹数据划分为训练数据和校验数据;
提取所述训练数据对应的第一轨迹特征;
根据机器学习模型对所述第一轨迹特征进行训练,得到初始轨迹分类模型;
提取所述校验数据对应的第二轨迹特征;
根据所述初始轨迹分类模型和所述第二轨迹特征确定所述轨迹分类模型。
在一些实施例中,所述根据所述初始轨迹分类模型和所述第二轨迹特征确定所述轨迹分类模型,包括:
将所述第二轨迹特征输入至所述初始轨迹分类模型,得到轨迹分类结果;
响应于所述轨迹分类结果与预设的分类结果的差值大于预设的阈值,对所述机器学习模型的参数进行调整,并根据调整后的机器学习模型对所述第一轨迹特征进行训练。
在一些实施例中,所述轨迹特征还包括以下至少一种:
速度、加速度、速度变化的最大值、速度变化的最小值、速度变化的均值、速度变化的中位数、速度变化的方差。
第二方面,本公开实施例提供了一种轨迹分类模型的训练装置,包括:
获取模块,用于获取轨迹数据;
计算模块,用于根据所述轨迹数据的时间特征和空间特征计算所述轨迹数据的轨迹特征,其中,所述轨迹特征包括曲率和/或转角;
训练模块,用于对所述轨迹特征进行训练,得到轨迹分类模型。
在一些实施例中,还包括:
预处理模块,用于对所述轨迹数据进行预处理;
则所述计算模块具体用于,根据预处理后的轨迹数据的时间特征和空间特征计算所述轨迹特征;
所述预处理包括:将满足至少一个条件的所述轨迹数据进行删除,得到所述预处理后的轨迹数据;
所述至少一个条件包括:
时间特征相同而空间特征不同;
空间特征超出预设区域范围的轨迹数据的数量小于预设比值。
在一些实施例中,所述计算模块还用于,根据所述轨迹数据的时间特征计算所述轨迹数据的采样时间的时间间隔;
响应于各个时间间隔均相同,由所述计算模块执行所述根据所述轨迹数据的时间特征和空间特征计算所述轨迹数据的轨迹特征。
在一些实施例中,还包括:
重采样模块,用于响应于至少一个时间间隔不同,根据线性差值采样法以预设时间间隔进行重采样,得到重采样后的轨迹数据;
所述计算模块具体用于,根据所述重采样后的轨迹数据的时间特征和空间特征计算所述轨迹特征。
在一些实施例中,其中,所述训练模块具体用于:
将所述轨迹数据划分为训练数据和校验数据;
提取所述训练数据对应的第一轨迹特征;
根据机器学习模型对所述第一轨迹特征进行训练,得到初始轨迹分类模型;
提取所述校验数据对应的第二轨迹特征;
根据所述初始轨迹分类模型和所述第二轨迹特征确定所述轨迹分类模型。
在一些实施例中,所述训练模块具体用于:
将所述第二轨迹特征输入至所述初始轨迹分类模型,得到轨迹分类结果;
响应于所述轨迹分类结果与预设的分类结果的差值大于预设的阈值,对所述机器学习模型的参数进行调整,并根据调整后的机器学习模型对所述第一轨迹特征进行训练。
本公开实施例提供的获取轨迹数据,根据轨迹数据的时间特征和空间特征计算轨迹数据的轨迹特征,其中,轨迹特征包括曲率和/或转角,对轨迹特征进行训练,得到轨迹分类模型的技术方案,实现了构建轨迹分类模型,且实现了轨迹分类模型的准确性的技术效果。
附图说明
附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:
图1为本公开实施例的轨迹分类模型的训练方法的示意图;
图2为本公开实施例的对轨迹数据进行重采样的方法的示意图;
图3为本公开实施例的对轨迹特征进行训练的方法的示意图;
图4为本公开另一实施例的轨迹分类模型的训练方法的示意图;
图5为本公开实施例的轨迹分类模型的训练装置的示意图;
图6为本公开另一实施例的轨迹分类模型的训练装置的示意图;
图7为本公开另一实施例的轨迹分类模型的训练装置的示意图;
附图标记:
1、获取模块,2、计算模块,3、训练模块,4、预处理模块,5、重采样模块。
具体实施方式
为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图对本发明提供的轨迹分类模型的训练方法和装置、电子设备、计算机可读介质进行详细描述。
在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。
如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、组件和/或其群组。
本文所述实施例可借助本公开的理想示意图而参考平面图和/或截面图进行描述。因此,可根据制造技术和/或容限来修改示例图示。因此,实施例不限于附图中所示的实施例,而是包括基于制造工艺而形成的配置的修改。因此,附图中例示的区具有示意性属性,并且图中所示区的形状例示了元件的区的具体形状,但并不旨在是限制性的。
除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
根据本公开实施例的一个方面,本公开实施例提供了轨迹分类模型的训练方法。
请参阅图1,图1为本公开实施例的轨迹分类模型的训练方法的示意图。
如图1所示,该方法包括:
s1:获取轨迹数据。
其中,轨迹数据就是时空环境下,通过对一个或多个移动对象运动过程的采样所获得的数据信息,包括采样点位置、采样时间等,这些采样点数据信息根据采样先后顺序构成了轨迹数据。
例如具有定位功能的智能手机,轨迹数据反映了手机持有者某一时间段的行动状况,移动互联网络可以通过无线信号定位手机所在位置,进而采样记录,通过连接采样点形成手机持有者的运动轨迹数据;gps定位终端,固定采样频率的记录终端所在位置的经纬度信息,通过无线网络将数据收集到服务器上;rfid标签技术,对物体进行标记,将物体的移动线路通过rfid识别器完成定位和位置数据记录,形成物体的移动轨迹。
s2:根据轨迹数据的时间特征和空间特征计算轨迹数据的轨迹特征,其中,轨迹特征包括曲率和/或转角。
基于上述对轨迹数据的描述可知,轨迹数据包括采样点位置和采样时间。其中,采样点位置即为轨迹数据的空间特征。采样时间即为轨迹数据的时间特征。
其中,轨迹特征即为移动对象运动的状态的特征。
在现有技术中,轨迹特征主要体现为速度。可以基于移动对象当前采样点的位置和时间与,前一采样点的位置和时间确定移动对象的速度。
而在本实施例中,轨迹特征包括曲率和/或转角。充分结合了时间特征和空间特征的相关性,以便实现后续训练的高效性和准确性。
在一些实施例中,轨迹特征还包括:速度、加速度、速度变化的最大值、速度变化的最小值、速度变化的均值、速度变化的中位数和速度变化的方差中的一种或多种。
具体地,速度v=δs/δt。其中,δs为基于空间特征确定的位移差,δt为基于时间特征确定的时间差。如:
移动对象当前采样点为t,前一采样点为i。采样点t的空间特征为经度t1,纬度t2。采样点i的空间特征为经度i1,纬度i2。则根据t1、t2、i1和i2确定移动对象由采样点t移动至采样点i之间的距离(即位移差)。具体的计算方法可参见现有技术,此处不再赘述。
采样点t的时间特征为时刻t3。采样点i的时间特征为时刻i3。则根据i3和t3确定移动对象由采样点i移动至采样点t之间的时间(即时间差)。具体的计算方法可参见现有技术,此处不再赘述。
具体地,加速度a=δv/δt。其中,δv为移动对象由采样点i移动至采样点t的速度变化量。
具体地,转角θ=arctan(|tanα-tanβ|)/(1+tanαtanβ)。其中,可基于采样点t的经度和纬度确定采样点t的角度α(如以经纬度均为0的点为原点建立坐标系,经过原点的南北极连线为纵坐标,经过原点且垂直纵坐标的线为横坐标)。并根据采样点i的经度和纬度确定采样点i的角度β。
具体地,曲率c=(dit+dtj)/dij。其中,dit为采样点i与采样点t之间的距离。dtj为采样点t与采样点j(采样点j为采样点t的后一采样点)之间的距离。dij为采样点i与采样点j之间的距离。
对上述其它轨迹特征的算法此处不再一一列举。
在一些实施例中,在获取到轨迹数据后,先对轨迹数据进行预处理,再基于预处理后的轨迹数据的计算轨迹特征。即在s1和s2之间还包括对轨迹数据进行预处理的步骤s11,而s2中是根据预处理后的轨迹数据进行相应的处理,进而得到轨迹特征。
在现有技术中,在获取到轨迹数据后,是直接对轨迹数据进行分析,进而对移动对象的类别进行判断。而在本实施例中,通过先对获取到的数据进行预处理,相当于对轨迹数据中的异常数据进行筛选,去除异常数据,而根据正常数据的时间特征和空间特征计算轨迹特征,进而确保轨迹特征的有效性。
其中,s11包括:将满足至少一个条件的轨迹数据进行删除,得到预处理后的轨迹数据。
至少一个条件包括:
(1)时间特征相同而空间特征不同;
(2)空间特征超出预设区域范围的轨迹数据的数量小于预设比值。
如,第一个条件:轨迹数据a的时间特征和轨迹数据b的时间特征相同,但是,轨迹数据a的空间特征和轨迹数据b的空间特征却不相同。即,在同一时刻获取到了两个不同的轨迹数据。则说明至少有一个轨迹数据是异常的。为了确保训练的精准性,将轨迹数据a和轨迹数据b均进行删除。
如,第二个条件:共有一千个轨迹数据,其中九百九十九个轨迹数据的空间特征均在北京范围内,而一个轨迹数据的空间特征却在上海范围内,说明空间特征在上海范围内的轨迹数据为异常数据,应当予以删除。
其中,比值的大小可基于实际需求进行设定。如,共有一千个轨迹数据,其中八百个轨迹数据的空间特征均在北京范围内,而两百个轨迹数据的空间特征在天津范围内。而北京与天津为相邻城市,移动对象由北京移动至天津为正常事件,则说明轨迹数据并无异常。
通过上述预处理的方式去除异常轨迹数据。可去除传感器上报数据的延迟性和网络阻塞,造成的轨迹数据重复或丢失的问题。且,可去除因传感器的偏差所造成的定位不准确的问题。
在一些实施例中,在执行s2之前,还包括对轨迹数据进行重采样的步骤。
请参阅图2,图2为本公开实施例的对轨迹数据进行重采样的方法的示意图。
如图2所示,对轨迹数据进行重采样的方法包括:
s12:根据轨迹数据的时间特征计算轨迹数据的采样时间的时间间隔。
s13:判断各个时间间隔是否均相同。如果是,则执行s2。如果不是,则执行s14。
s14:根据线性差值采样法以预设时间间隔进行重采样,得到重采样后的轨迹数据。
并执行s2,s2具体为:根据重采样后的轨迹数据的时间特征和空间特征计算轨迹特征。
由于传感器的原因,或者网络原因等,获取到的轨迹数据的对应的频率(即采样时间的时间间隔)可能不一致。进而造成训练结果不精准的技术问题。而通过本实施例提供的根据频率确定重采样,并通过线性差值采样法以预设时间间隔进行重采样,可确保重采样后的轨迹数据的准确性和一致性。
在一些实施例中,通过线性差值采样法以预设时间间隔进行重采样为:根据相邻两个采样点的空间特征和时间特征在该两个相邻的采样点之间插入至少一个采样点。
在一些实施例中,在s1之后,在s2之前,还包括s1-2:对轨迹数据进行平滑处理。
具体地,可通过卡尔曼滤波(kalmanfilter)平滑方法实现。
通过对轨迹数据进行平滑处理,可以消除因传感器等设备的误差造成的获取到的轨迹数据的误差,实现对获取到的轨迹数据进行去燥,减小误差的技术效果。
其中,s1-2与s12至s14为独立的步骤。也就是说,在一些实施例中,可仅包括平滑处理的步骤。在一些实施例中,可仅包括对轨迹数据进行重采样的步骤。为了确保轨迹数据的准确性和一致性,在一些实施例中,还可同时包括平滑处理的步骤和对轨迹数据进行重采样的步骤。
当为同时包括平滑处理的步骤和对轨迹数据进行重采样的步骤实施例时,优选地,先执行对轨迹数据进行重采样的步骤,再执行平滑处理的步骤。以便确保处理轨迹数据的高效性。
s3:对轨迹特征进行训练,得到轨迹分类模型。
其中,训练的过程可采用现有技术中的方式。如通过网络神经模型对轨迹特征进行训练。此处不做限定。
结合图3可知,在一些实施例中,s3包括:
s31:将轨迹数据划分为训练数据和校验数据。
在该步骤中,将轨迹数据分为两部分。一部分轨迹数据为训练数据,另一部分轨迹数据为校验数据。
如,从轨迹数据中随机选取80%的轨迹数据作为训练数据,将剩余的20%的轨迹数据作为校验数据。
s32:提取训练数据对应的第一轨迹特征。
s33:根据机器学习模型对第一轨迹特征进行训练,得到初始轨迹分类模型。
其中,机器学习模型为蟒蛇(python)的sklearn机器学习模型。其内设置有集成学习的梯度提升决策树模型(gradientboostdecisiontree,gbdt)。
具体地,将第一轨迹特征作为sklearn机器学习模型的输入,将与第一轨迹特征的类别作为sklearn机器学习模型的结果的标签,训练得到初始轨迹分类模型。
s34:提取校验数据对应的第二轨迹特征。
s35:根据初始轨迹分类模型和第二轨迹特征确定轨迹分类模型。
在该步骤中,根据第二轨迹特征对触角轨迹分类模型进行修正,得到轨迹分类模型。
在本实施例中,通过使用训练数据进行训练,得到初始轨迹分类模型,使用校验数据对初始轨迹分类模型进行校验,得到轨迹分类模型的方案,可确保轨迹分类模型的有效性和准确性。
在一些实施例中,s35包括:
s351:将第二轨迹特征输入至初始轨迹分类模型,得到轨迹分类结果。
s352:响应于轨迹分类结果与预设的分类结果的差值大于预设的阈值,对机器学习模型的参数进行调整,并根据调整后的机器学习模型对第一轨迹特征进行训练。
机器学习模型的参数包括:树深、个数、最大叶子节点个数等。如果轨迹分类结果与预设的分类结果的差值大于预设的阈值,则说明初始轨迹分类模型的精确度偏低,则对树深、个数、最大叶子节点个数等中的至少一个参数进行调整。以便基于调整后的机器学习模型对第一轨迹特征进行训练。直至轨迹分类结果与预设的分类结果的差值小于或等于阈值。
结合图4可知,在一些实施例中,该方法还包括:s4:通过轨迹分类模型对待分类轨迹数据进行分类。
如,将待分类轨迹数据输入至轨迹分类模型,根据轨迹分类模型的输出结果可以确定待分类轨迹数据的类型。即,移动对象的类型。
根据本公开实施例的另一个方面,本公开实施例还提供了一种轨迹分类模型的训练装置。
请参阅图5,图5为根据本公开实施例的轨迹分类模型的训练装置的示意图。
如图5所示,该装置包括:
获取模块1,用于获取轨迹数据;
计算模块2,用于根据轨迹数据的时间特征和空间特征计算轨迹数据的轨迹特征,其中,轨迹特征包括曲率和/或转角;
训练模块3,用于对轨迹特征进行训练,得到轨迹分类模型。
结合图6可知,在一些实施例中,该装置还包括:
预处理模块4,用于对轨迹数据进行预处理。
预处理包括:将满足至少一个条件的轨迹数据进行删除,得到预处理后的轨迹数据;
至少一个条件包括:
时间特征相同而空间特征不同;
空间特征超出预设区域范围的轨迹数据的数量小于预设比值。
计算模块2具体用于,根据预处理后的轨迹数据的时间特征和空间特征计算轨迹特征。
在一些实施例中,计算模块2还用于:根据轨迹数据的时间特征计算轨迹数据的采样时间的时间间隔;
响应于各个时间间隔均相同,则由计算模块2执行根据轨迹数据的时间特征和空间特征计算轨迹数据的轨迹特征。
结合图7可知,在一些实施例中,该装置还包括:
重采样模块5,用于响应于至少一个时间间隔不同,根据线性差值采样法以预设时间间隔进行重采样,得到重采样后的轨迹数据。
计算模块2具体用于:根据重采样后的轨迹数据的时间特征和空间特征计算轨迹特征。
在一些实施例中,训练模块3具体用于:
将轨迹数据划分为训练数据和校验数据;
提取训练数据对应的第一轨迹特征;
根据机器学习模型对第一轨迹特征进行训练,得到初始轨迹分类模型;
提取校验数据对应的第二轨迹特征;
根据初始轨迹分类模型和第二轨迹特征确定轨迹分类模型。
在一些实施例中,训练模块3具体用于:
将第二轨迹特征输入至初始轨迹分类模型,得到轨迹分类结果;
响应于轨迹分类结果与预设的分类结果的差值大于预设的阈值,对机器学习模型的参数进行调整,并根据调整后的机器学习模型对第一轨迹特征进行训练。
在一些实施例中,轨迹特征还包括:
速度、加速度、速度变化的最大值、速度变化的最小值、速度变化的均值、速度变化的中位数和速度变化的方差中的一种或多种。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式和细节上的改变。