一种基于svm的步态功能评估模型的构建方法与流程

文档序号:16250566发布日期:2018-12-11 23:59阅读:193来源:国知局
一种基于svm的步态功能评估模型的构建方法与流程

本发明涉及运动数据处理及评估技术领域,具体涉及一种基于svm的步态功能评估模型的构建方法。

背景技术

步态是人体行走的姿态,其中包括了人体躯干、上肢以及下肢的运动和配合。在工程领域,对于步态的功能评估是步态分析中的一个重要内容,在临床上,它可以帮助临床医生了解患者是否存在平衡功能障碍,找出引起功能障碍的原因,判断治疗手段是否有效;在日常生活中,人们对步态功能评估的研究,可以规避摔倒的风险,降低摔倒带来的生命威胁和身体损伤。另外,步态功能评估可反映运动功能的健全与否,对于健康人,尤其是老人和儿童,以及运动功能障碍的病人的生活和安全非常重要。

目前,步态功能评估方法中采用的通常是常规参数(如单侧下肢运动功能的评定中使用时相百分比、关节角度、关节角速度、加速度等)和肌肉特征(如肌肉收缩程度及其力学特性参数等较微观的肌肉运动特征)这两种评定指标以及第三类评定指标(如表征步行对称性质的步长对称指标、地面反力对称指标,表征下肢动作执行情况基于fitts定律的对称指标等),这种通过单个参数的比较从而对个体进行总体评价的方法无法客观、准确地反应待测试者的真实信息;另外,这种评估方法在步态功能分析方面大多依赖医生的经验以及患者自身的感觉来评估,缺乏科学性,结果有可能会严重失实。



技术实现要素:

针对现有技术的不足,本发明提出一种基于svm的步态功能评估模型的构建方法,克服了现有技术中凭个人经验判断对步态功能进行评估时主观性过强的缺点,也避免了现有技术中仅通过单个参数的比较对个体进行总体评估时无法客观、准确地反应待测试者的真实信息的问题。

本发明的技术方案是这样实现的:一种基于svm的步态功能评估模型的构建方法,包括以下步骤:

步骤10,获取健康成人及患有运动功能障碍疾病患者的步态特征的数据组,所述步态特征包括周期、步幅、步速、步频、左步长、右步长、左支撑相、右支撑相、地反力、表面肌力、足偏角、髋关节屈曲值、髋关节伸展值、膝关节屈曲值、膝关节伸展值、关节力矩中的多种或全部;

步骤20,将采集到的步态特征数据形成原始矩阵并确定原始矩阵x的相关系数矩阵r,其中,x1j~xij表示其中一个步态特征的数据组,j=1,2,3…j;xi1~xij表示其中一人的所有步态特征数据,i=1,2,…,i;

步骤30,求出r的特征方程det(r-λe)=0的特征根λj,其中λ1≥λ2≥λ3…≥λj≥0;

步骤40,确定主成分个数m,然后确定m个相应的单位特征向量βm,其中m=1,2,…,m;

步骤50,根据单位特征向量βm及原始矩阵确定主成分矩阵z;

步骤60,根据主成分矩阵z确定svm分类器模型,所述svm分类器模型为步态功能评估模型。

可选的,步骤30中,相关系数矩阵r的表达式为:

r=(rij)i×j,其中rij=rji,rii=1。

可选的,步骤40中,所述主成分的个数m通过以下公式确定:

其中α为60%~80%。

可选的,步骤40中,βm的表达式为:

其中

可选的,步骤50中,所述主成分矩阵的表达式为:其中

zj=β1x1+β2x2+…+βmxj,

x1、x2、…xj、分别表示由各个步态特征的数据组形成的矩阵。

可选的,将主成分矩阵中的数据作为新样本数据,将新样本数据平均划分为s份子样本,其中的s-1份子样本作为训练集,其余的作为校验集;分别通过可能形成的s种训练集确定相应svm分类器的模型,并通过相应校验集分别对相应模型进行验证,计算出相应模型的准确率,以其中准确率最高的模型作为步态功能评估模型。

可选的,所述svm分类器的模型为f(z)=sign(w*z+b*),其中最优法向量w*和最优截距b*的值根据最优分界面的条件确定。

可选的,所述最优分界面的条件为:

s.t.yi(w·zi+b)≥1-ξi,i=1,2,…,n

ξi≥0,i=1,2,…,n

其中,w为法向量,b为截距,c为惩罚项参数,ξi为对应的样本点的松弛变量,yi为主成分矩阵第i条数据组的类别标签。

可选的,所述最优分界面通过构建拉格朗日函数求解,所构建的拉格朗日函数为:

αi≥0,μi≥0。

其中,αi,μi为拉格朗日乘子。

与现有技术相比,本发明具有以下优点:本发明根据原始数据确定的主成分矩阵,去掉了冗余的对预测结果影响不大的参数,最大限度地保持了原有步态特征数据的信息,最后根据主成分矩阵建立svm分类器模型作为步态功能评估模型,准确度更高,且更客观、科学,可为医生或患者在诊断待测试者的步态功能是否异常时提供参考。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一种基于svm的步态功能评估模型的构建方法实施例一的流程图;

图2为本发明一种基于svm的步态功能评估模型的构建方法实施例二的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明一种基于svm的步态功能评估模型的构建方法实施例一的流程图,参阅图1,本实施例一公开的基于svm的步态功能评估模型的构建方法,包括以下步骤:

步骤101,获取健康成人及患有运动功能障碍疾病患者的步态特征的数据组,所述步态特征包括周期、步幅、步速、步频、左步长、右步长、左支撑相、右支撑相、地反力、表面肌力、足偏角、髋关节屈曲值、髋关节伸展值、膝关节屈曲值、膝关节伸展值、关节力矩中的多种或全部;

其中,可通过三维步态捕捉仪器对相应步态特征进行采集数据。另外,在选取样本的过程中,样本的年龄应均匀分布在20~70之间,男女比例尽可能维持在1:1,样本中受试者人数应数不低于50人。而且,在采集步态特征的数据组的过程中,每次采集10次,从中选择采集最好的一次,以提高评估模型的准确性。

进一步的,所采取的样本个数应不低于1500例,样本个数越高则所建立的模型越准确。而且,患有运动功能障碍疾病患者的占比应不低于20%,健康成人的占比应不低于20%,避免样本的正负不平衡影响模型的准确率。

步骤102,将采集到的步态特征数据形成原始矩阵并确定原始矩阵x的相关系数矩阵r;

其中,x1j~xij表示其中一个步态特征的数据组,j=1,2,3…j;例如,x11~xi1表示周期这一步态特征的数据组,x12~xi2表示步幅这一步态特征的数据组,x13~xi3表示步速这一步态特征的数据组,……,以此类推。

xi1~xij表示其中一人的所有步态特征数据,i=1,2,…,i;例如,x11~x1j表示健康成人甲的所有步态特征数据,包括周期、步幅、步速、步频、左步长、右步长等;x21~x2j表示健康成人乙的所有步态特征数据,也包括周期、步幅、步速、步频、左步长、右步长等;x21~x2j表示患有运动功能障碍疾病患者丙的所有步态特征数据,也包括周期、步幅、步速、步频、左步长、右步长等;……,以此类推。

本发明实施例中,相关系数矩阵r的表达式为:

r=(rij)i×j,其中rij=rji,rii=1。

步骤103,求出r的特征方程det(r-λe)=0的特征根λj,其中λ1≥λ2≥λ3…≥λj≥0;

本发明实施例中,将求出的特征根从大到小排列,分别定义为λ1,λ2,λ3,…,λj,用于后面根据各特征根确定主成分个数m。

步骤104,确定主成分个数m,然后确定m个相应的单位特征向量β1、β2、…、βm,其中m=1,2,…,m;

本发明实施例中,可根据确定α的主成分个数m,其中α为60%~80%。

另外,单位特征向量βm为其中i=1,2,…,i,β1m、β2m、…βim为单位特征向量βm的分量。如

其中以此类推。xim为原始矩阵x中的相对应的数值。

步骤105,根据单位特征向量βm及原始矩阵确定主成分矩阵z;

本发明实施例中的主成分矩阵为由子矩阵z1、z2、…zj形成,即其中:

zj=β1x1+β2x2+…+βmxj,x1、x2、…xj为原始矩阵z的子矩阵,即分别由各个步态特征的数据组形成的矩阵。

另外,主成分矩阵z中,zi1~zij的类别与原始矩阵中x1j~xij的类别相对应。

步骤,106,根据主成分矩阵z确定svm分类器模型;

本发明实施例中,将主成分矩阵中的数据作为新样本数据来确定svm分类器模型。其具体包括以下子步骤:

步骤1061,首先将新样本数据平均划分为s份子样本,其中的s-1份子样本作为训练集,其余的作为校验集,通过训练集确定svm分类器的模型,并通过校验集对该模型进行验证,计算出该模型的准确率;

步骤1062,将可能出现的s种分类器模型按照步骤402进行训练,以s次测评中准确率最高的模型作为步态功能评估模型。本发明实施例中,svm分类器的模型为f(x)=sign(w*z+b*),根据最优分界面的条件可确定最优法向量w*和最优截距b*的值。

进一步的,由于所有的数据并不是那么干净,不可能100%线性可分,因此本发明实施例在最优分界面条件中引入松弛变量ξi,允许有些数据点可以处于分割面的错误的一侧,便于求出最优法向量w*和最优截距b*的值,则此时最优分界面的条件为:

s.t.yi(w·zi+b)≥1-ξi,i=1,2,…,n

ξi≥0,i=1,2,…,n

其中,w为法向量,b为截距,常数c为惩罚项参数,ξi为对应的样本的松弛变量,zi表示新样本数据中的第i条数据组,yi为新样本数据中第i条数据组的类别标签。为此,引入拉格朗日乘子αi,用条件极值求解最优分界面,因此根据最优分界面的条件构造的拉格朗日函数为:

该拉格朗日函数中,μi也为拉格朗日乘子,αi≥0,μi≥0。

其中,最优化界面的条件的对偶问题为:

c-αi-μi=0

αi≥0

μi≥0,i=1,2…,n

由于该对偶问题为凸二次规划问题,故解满足kkt条件,因此可得:

为对偶问题的解,则可通过上述方程得最优法向量w*和最优截距b*的值为:

因此,也可得到分离超平面为:则分类决策函数为

由于在对偶问题中,无论是目标函数还是决策函数都只涉及到输入实例与实例之间的内积,对偶问题的目标函数中的内积(zi·zj)可以用核函数k(zi,zj)=(zi·zj)来代替,此时对偶问题的目标函数为:

0≤αi≤c,i=1,2,…,n

此时,svm分类器的模型可转化为:因此只要确定拉格朗日乘子即可确定svm分类器的模型。

由于拉格朗日乘子αi满足kkt条件,因此设α1、α2为变量,α3,α4,…,αn为定量,则由目标函数中的约束方程可知当α2可确定,则知α1也随之确定。因此,可将对偶问题的目标函数转化为:

0≤αi≤c,i=1,2

其中kij=zi·zj,如k11=z1·z2,k12=z1·z2…等,设上述方程的初始解为最优解为并且假设在约束向未经剪辑时α2的最优解为

由于需要满足不等式约束条件0≤αi≤c,i=1,2,所以最优值的取值范围为:因此有:

若y1=y2,则有

若y1≠y2,则有

在更新α1,α2的过程中,应满足如下等式:

其中,

η=k11+k22—2k12

因此,通过不断调整使其满足上述方程,即使αi满足kkt条件,最终求出α1,α2的最优解,同理可以求出α3,α4,…,αn的最优解,从而最终确定拉格朗日乘子的最优解。

本发明通过对原始数据进行变换,去掉了冗余的对预测结果影响不大的参数,变换后只需要少量新变量就能解释原始数据中的大部分变异,从而提高模型的精确度。本发明通过选取真正对预测有价值的信息属性,排除多重相关属性间的互相干扰,使预测结果更准确。

图2为本发明一种基于svm的步态功能评估模型的构建方法实施例二的流程图,参阅图2,本实施例二公开的基于svm的步态功能评估模型的构建方法,包括以下步骤:

步骤201,获取健康成人及患有运动功能障碍疾病患者的步态特征的数据组;其中,所述步态特征包括周期、步幅、步速、步频、左步长、右步长、左支撑相、右支撑相、地反力、表面肌力、足偏角、髋关节屈曲值、髋关节伸展值、膝关节屈曲值、膝关节伸展值、关节力矩中的多种或全部;

如表1中所采集到的一个样本为例:

表1

该样本中所采集的步态特征分别为周期、步幅、步速、步频、左步长、右步长、左支撑相和右支撑相,设x1,x2,x3,x4,x5,x6,x7,x8分别表示周期、步幅、步速、步频、左步长、右步长、左支撑相、右支撑相的步态特征数据组,xij为上表中第i行第j列个数据。如序号为3的步速为112,即x33表示为=112。

步骤202,对所述步态特征的数据组进行预处理,所述预处理包括缺失数据的填补和异常数据的剔除;

当存在空值时,可采用平均值填补。如表1中,x57为空值,可采用平均值代替,即

当存在异常数据时,采用最近邻插补法进行剔除,即在记录中找到与该样本数据最佳捷径的样本的该属性值进行插补。如表1中,周期都在1s左右,而序号为4的周期为2.2,在步速、步频等参数和其他序号的参数大致相同的情况下,不应该会出现这么大的差别,推测估计有可能是测量过程或者在记录过程中说产生的误差,对于该异常数据,通过分析发现,序号为3的各参数与序号为4的各参数几乎相同,则可用序号为3的周期数值1.04来取代序号4的周期数值。

进一步的,本发明实施例中的步骤202是在缺失的数据量和/或异常值比较多的情况下采用,若缺失的数据量和/或异常值比较小,可以不采用步骤202。

步骤203,将采集到的步态特征数据形成原始矩阵并确定原始矩阵x的相关系数矩阵r,其中,x1j~xij表示其中一个步态特征的数据组,j=1,2,3…j;xi1~xij表示其中一人的所有步态特征数据,i=1,2,…,i;

如表1中,可得矩阵该矩阵中x1j~xij分别是采集到的相应步态特征数据组,x11~xi1的值分别为1.2、1.02、1.04、2.2、1.1,为本样本中周期的数据组,如x12~xi2的值分别为113、137、117、118、115,为本样本中步幅的数据组,……等。xi1~xij为其中一人的所有步态特征数据,如x11~x1j表1中所采集到的第一个人的步态特征数据,分别为1.2、113、109、100、57、61、59、59,且该人为健康成人;如x31~x3j表1中所采集到的第三个人的步态特征数据,分别为1.04、117、112、115、62、65、60、60,且该人为患有运动功能障碍疾病患者。

步骤204,求出r的特征方程det(r-λe)=0的特征根λj,其中λ1≥λ2≥λ3…≥λj≥0;

本发明实施例中,特征根λj的确定与与实施例一相同。

步骤205,确定主成分个数m,然后确定m个相应的单位特征向量βm,其中m=1,2,…,m;

本发明实施例中,可根据确定α的主成分个数m,其中α为60%~80%。

另外,单位特征向量βm为其中i=1,2,…,i,β1m、β2m、…βim为单位特征向量βm的分量。如

其中以此类推。xim为原始矩阵x中的相对应的数值。

步骤206,根据单位特征向量βm及原始矩阵确定主成分矩阵z;

本发明实施例中的主成分矩阵为由子矩阵z1、z2、…zj形成,即其中:

zj=β1x1+β2x2+…+βmxj,x1、x2、…xj为原始矩阵z的子矩阵,即分别由各个步态特征的数据组形成的矩阵,如表1中,

并且,主成分矩阵z中,zi1~zij的类别与原始矩阵中x1j~xij的类别相对应,如表1中,x11~x1j相对应的人的类别为健康成人,则z11~z1j相对应的类别也为健康成人,如此类推。

步骤207,根据主成分矩阵z确定svm分类器模型,所述svm分类器模型为步态功能评估模型。

本发明实施例中,将主成分矩阵中的数据作为新样本数据,将新样本数据平均划分为s份子样本,其中的s-1份子样本作为训练集,其余的作为校验集;分别通过可能形成的s种训练集确定相应svm分类器的模型,并通过相应校验集分别对相应模型进行验证,计算出相应模型的准确率,以其中准确率最高的模型作为步态功能评估模型。

例如,s-1份子样本作为训练集和1份校验集,有可能会出现s种svm分类器的模型。如当s=7,即将该步态特征的数据平均分为7个小样本,编号分别为1、2、3、4、5、6、7,取其中的6份作为训练集,1份作为校验集,则可有7种组合方式。例如,编号1的小样本作为校验集,剩下编号为2、3、4、5、6的小样本作为训练集;编号2的小样本作为校验集,剩下编号为1、3、4、5、6的小样本作为训练集,依次类推,第七次则是把编号7的小样本作为校验集,编号为1、2、3、4、5、6的小样本作为训练集。因此,本发明分别对这七种组合方式进行训练和校验,选取其中准确率最高的分类器模型作为步态功能评估模型,可有效提高评估模型的精确度。

本发明实施例中,svm分类器的模型f(x)=sign(w*z+b*)的确定过程与实施例一相同,因此有:

其中,为拉格朗日乘子,yi为新样本数据中第i条数据的类别标签,zi为新样本数据中的第i条数据,zj为新样本数据中的第i列数据。以表2、表3为例,z1代表序号为1的数据(1.11,39,35,118,74,82,58,60),此时y1代表序号为1的类别标签0(即不患病)。

拉格朗日乘子的确定过程与实施例一相同,这里就不再一一赘述。

基于svm的步态功能评估模型建立好后,进行步态功能评估,帮助临床医生了解患者是否存在平衡功能障碍,为医生提供参考。

本发明通过对原始数据进行变换,根据变换后的主成分矩阵建立步态功能评估模型,去掉了冗余的对预测结果影响不大的参数而最大限度地保持了原有步态特征数据的信息,使得所建立的模型准确度更高,避免了个人主观性判断和单个参数性判断的问题,客观且科学。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1