一种基于稀疏表示的帕金森病数据集分类方法与流程

文档序号:20083916发布日期:2020-03-13 05:59阅读:341来源:国知局
一种基于稀疏表示的帕金森病数据集分类方法与流程
本发明涉及帕金森病数据集分类方法,特别是一种基于稀疏表示的帕金森病数据集分类方法。
背景技术
:帕金森病是一种退行性神经疾病,早期难以察觉而常被忽视,检测语言障碍将具有便利性,低成本,无创等优势。对帕金森病公共数据集的分类研究将有助于帕金森早期诊断的临床实践,现有基于语音特征的帕金森病数据集分类方法算法复杂度较高,并不利于工程实现,本发明实现了一种基于稀疏表示的帕金森病数据集分类方法。技术实现要素:针对现有技术,本发明提供了一种基于稀疏表示的帕金森病数据集分类方法。该方法包括以下步骤:(1)对m个受试者(m1健康人,m2患者)每人采集h0段语音,每段语音提取n个帕金森语音相关特征,构成特征矩阵(2)语音特征集变换。变换后语音特征集为其中(3)零均值(z-score)标准化s′生成新集合s″;(4)将标准数据集s″按留一法划分为训练集及相应标签和测试集及相应标签yt=bm,其中标签bm∈{0,1};(5)求解稀疏表示满足xma=xt,其中是稀疏列向量;(6)计算残差i=1,2,其中保留健康人所在组参数,将患者所在组参数置0,保留患者所在组参数,将健康人所在组参数置0;(7)通过比较残差r1(xt)和r2(xt)大小,若r1(xt)较小则测试集xt类别属于健康人,否则属于患者;(8)将预测的测试集类别与实际类别进行比较,并遍历整个数据集得到平均分类准确率。附图说明图1是根据本发明的一个实施例构成的系统方框图;具体实施方式本发明提出的帕金森病数据集分类方法结合附图及实施例进一步说明如下:本发明的方法流程如图1所示,包括以下步骤:(1)样本数据集由m个受试者(m1健康人,m2患者)每人采集h0段语音,每段语音提取n个帕金森语音相关特征构成;(2)样本数据集进行转换构成特征矩阵并零均值(z-score)标准化;(3)将标准化后特征矩阵按留一法划分为训练集和测试集;(4)求解测试集的稀疏表示;(5)通过比较残差大小判决测试集类别并遍历整个数据集得到平均准确率;本发明的上述技术方案与现有技术方案相比较,具有以下优点:a、相比已有方法计算复杂度较低;b、平均分类准确率较高;c、能有效兼容计算复杂度和分类准确率,具有良好工程前景。本发明上述方法各步骤的具体实施例详细说明如下:上述步骤(1)中数据集由sakar等人建立并从加州大学欧文分校(uci)机器学习数据库网站获取。主要选取名为“trainning_data”的数据集,其中包含m=40名受试者,m1=20名健康受试者,m2=20患者受试者,每一个测试对象包含了h0=26个语音样本,具体样本参考表1,每一个语音样本设置n=26个特征,具体特征参考[1]:b.e.sakar,m.e.isenkul,c.o.sakar,a.sertbas,f.gurgen,s.delil,h.apaydin,o.kursun.collectionandanalysisofaparkinsonspeechdatasetwithmultipletypesofsoundrecordings.ieeejournalofbiomedical&healthinformatics.17,828-834(2013).来设定。表1:语音样本信息样本序列样本描述第1个持续元音aaa第2个持续元音ooo第3个持续元音uuu第4个~第13个数字1~10第14个~第17个预设的短句第18个~第26个预设的单词上述步骤(4)中求解稀疏表示的方法为正交匹配追踪算法(omp);上述步骤(5)中平均准确率的计算方法为:当预测的第m个测试集类别与实际类别相同时,测试集准确率否则则平均准确率当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1