一种用于医生胜任力模型构建的数据处理方法
【专利摘要】本发明公开了一种用于医生胜任力模型构建的数据处理方法,包括数据筛选、数据分解、无效数据二次筛选、有效数据单元的二次融合和无效数据单元的处理这五个步骤,与现有技术相比,本发明通过对现有技术中进行剔除的无效数据进行重新利用,大大减少了由于数据剔除而对原始数据样本信息的损失。在对无效数据进行二次利用的同时保持了原始有效数据的可靠性。
【专利说明】一种用于医生胜任力模型构建的数据处理方法
【技术领域】
[0001]本发明涉及一种数据处理方法,尤其涉及一种用于医生胜任力模型构建的数据处理方法。
【背景技术】
[0002]关于医学人才培养模式研究的文献有很多,大多通过制定专门性培养方案、培养模式、师资建设、建立健全保障体系等措施培养卓越医师。在对医生胜任力评价体系中,需要对大量的复杂统计数据进行筛选处理,从而剔除相对无效的数据,减小数据处理的工作量,提高数据处理的效率。现有技术的研究重点是对如何优选数据。但是,无论如何优选,只要剔除数据,就会对样本本身所要体现的信息产生偏差影响,无法实现样本信息的充分利用。
【发明内容】
[0003]本发明的目的就在于为了解决上述问题而提供一种用于医生胜任力模型构建的数据处理方法。
[0004]本发明通过以下技术方案来实现上述目的:
[0005]本发明包括以下步骤:
[0006](I)数据筛选:先后使用KMO数据值、巴菲力特球形检验数据对源数据进行筛选,选取KMO数据值大于0.5和巴菲力特球形检验数据小于0.05的数据为有效数据,其余数据为无效数据;
[0007](2)数据分解:将所有数据按照数据内容的不同分成若干个维度;
[0008](3)无效数据二次筛选:筛选出有效数据中每个数据维度的最大值和最小值,然后使用无效数据每个维度中的数据单元与相同维度中有效数据的最大值和最小值进行比较,若无效数据中的数据单元位于有效数据的最大值和最小值之间,则将这一无效数据中这一维度的数据单元标记为有效数据单元,否则,继续标记为无效数据单元;
[0009](4)有效数据单元的二次融合:计算每个有效数据各维度的平均值,然后将无效数据中标记为有效数据单元的数据代替相应维度的平均值,其它维度仍然使用本维度的平均值,形成一个新的有效数据单元,将所有新得到的有效数据单元使用第一加权因子进行加权处理后,融合入原有的有效数据单元中;
[0010](5)无效数据单元的处理:将步骤C中仍然标记为无效的数据单元按照维度的相关性进行重新排序,然后对各个维度进行权重排序,按照维度权重值由低到高的顺序依次选取各个维度的无效数据单元作为目标值对其相邻的无效数据单元进行线性拟合,拟合出的各个维度的数据组成的曲面作为医生胜任力模型构建的二次检查标准。
[0011]进一步,步骤(4)中,第一加权因子的计算公式为:
[0012]a= l/elw 核Ftt2Il
O
[0013]步骤(4)中,将融合后形成的新的有效数据再次进行步骤(I)中的筛选过程,如果符合步骤(I)中的标准,则无需追加处理,如果不符合步骤(I)中的标准,则对第一加权因子进行调整,直至新的有效数据符合步骤(I)的标准。对第一加权因子进行调整的步骤为:选取第一加权因子的1%作为迭代步长,任意选取正向或负向迭代,通过迭代前后的结果变化率和迭代结果与目标结果差值的绝对值的计算,确定下一次迭代变化量,其关系为,
[0014]q = D/k。
[0015]本发明的有益效果在于:
[0016]本发明是一种用于医生胜任力模型构建的数据处理方法,与现有技术相比,本发明通过对现有技术中进行剔除的无效数据进行重新利用,大大减少了由于数据剔除而对原始数据样本信息的损失。在对无效数据进行二次利用的同时保持了原始有效数据的可靠性。
【具体实施方式】
[0017]下面对本发明作进一步说明:
[0018]本发明包括以下步骤:
[0019](I)数据筛选:先后使用KMO数据值、巴菲力特球形检验数据对源数据进行筛选,选取KMO数据值大于0.5和巴菲力特球形检验数据小于0.05的数据为有效数据,其余数据为无效数据;
[0020](2)数据分解:将所有数据按照数据内容的不同分成若干个维度;
[0021](3)无效数据二次筛选:筛选出有效数据中每个数据维度的最大值和最小值,然后使用无效数据每个维度中的数据单元与相同维度中有效数据的最大值和最小值进行比较,若无效数据中的数据单元位于有效数据的最大值和最小值之间,则将这一无效数据中这一维度的数据单元标记为有效数据单元,否则,继续标记为无效数据单元;
[0022](4)有效数据单元的二次融合:计算每个有效数据各维度的平均值,然后将无效数据中标记为有效数据单元的数据代替相应维度的平均值,其它维度仍然使用本维度的平均值,形成一个新的有效数据单元,将所有新得到的有效数据单元使用第一加权因子进行加权处理后,融合入原有的有效数据单元中;
[0023](5)无效数据单元的处理:将步骤C中仍然标记为无效的数据单元按照维度的相关性进行重新排序,然后对各个维度进行权重排序,按照维度权重值由低到高的顺序依次选取各个维度的无效数据单元作为目标值对其相邻的无效数据单元进行线性拟合,拟合出的各个维度的数据组成的曲面作为医生胜任力模型构建的二次检查标准。其曲面方程优选为球面方程x2+y2+z2 = R2或椭球面方程x2/a2+y2/b2+Z2/c2 = I。
[0024]具体地,所述步骤(4)中,第一加权因子的计算公式为:
[0025]
O
[0026]式中:Xn为新有效数据的第η维数据单元,yn为与此新有效数据欧式距离最近的源数据中的有效数据的第η维数据单元。
[0027]步骤(4)中,将融合后形成的新的有效数据再次进行步骤(I)中的筛选过程,如果符合步骤(I)中的标准,则无需追加处理,如果不符合步骤(I)中的标准,则对第一加权因子进行调整,直至新的有效数据符合步骤(I)的标准。对第一加权因子进行调整的步骤为:选取第一加权因子的1%作为迭代步长,任意选取正向或负向迭代,通过迭代前后的结果变化率和迭代结果与目标结果差值的绝对值的计算,确定下一次迭代变化量,其关系为,
[0028]q = D/k。
[0029]式中:k为迭代前后的结果变化率,D为迭代结果与目标结果差值的绝对值,q为下一次迭代变化量。
[0030]上述有效/无效数据由多个维度的有效/无效数据单元组成,处理过程是通过对有效/无效数据单元的处理从而实现对有效/无效数据进行处理。
[0031]在使用上述数据处理方法前,需要对数据样本进行收集和整理。
[0032]通过访谈法与标准文献总结相结合的途径来建立胜任力要素辞典。对访谈录音进行文本化处理和频次分析,选取访谈过程中出现频率大于30 %的品质和事件进行整理,并把个性化的具有中医特点的特征统一提炼出来,用符合中医语言习惯的方式进行描述。此后,把品质特征作尝试性的定义,有的定义在GMER、教育部标准等相应要求中可以找到,但大多数需要自己来描述和确认。获得的29项品质特征。将访谈所得的29项特征结合国际GMER标准(《全球医学教育最低基本要求》)进行改编,参照结合《中医学本科(CMD前)教育毕业生基本要求》标准,分析关于中医医生胜任素质的文献,将标准进行操作化定义。在29项特征基础上进行了量表题目的编制,每一项特征进行了问题的设计,最终形成胜任力特征辞典。
[0033]在此中医卓越胜任力辞典的基础上,进一步对71项品质和问题进行排查筛选,采取李克特五点计分形成量表。对每个项目的得分进行专家组和对照组的独立样本T检验,检验结果显著说明该项目在专家组和对照组之间存在差异,能够起到鉴别出专家与普通医生的作用,该项目鉴别力较好。检验结果不显著说明该项目专家组和对照组之间差异不显著,不能很好的鉴别出专家与普通医生,该项目鉴别力较差。以专家组和对照组之间独立样本T检验结果作为项目分析的鉴别力标准,有22个项目由于没有达到显著性水平,不能起到鉴别的作用被删除。其余49个项目由于T检验结果达到显著性,鉴别力较好而被保留。将保留的49道题目以随机方式编制成初测问卷。
[0034]对包含49道题项的220份数据进行探索性因子分析,KMO数据值为0.849,巴菲力特球形检验显著性水平P < 0.001。选取特征根大于I为截取公因子标准,结果共有9公因子特征根大于1,从分析可以得出只有前5个公因子贡献率较大,从第6个因子开始贡献率增加缓慢。
[0035]经最大四次方旋转后删除因子负荷小于0.5的题目,以及因子归属不明确的题目共8项(第2、20、26、34、44、46、48、49题),保留的41项分属5个因子,其中第一因子9项,第二因子8项,第三因子8项,第四因子8项,第五因子8项。
[0036]使用本实施例提及的数据方法对筛选出的有效数据和无效数据进行重新处理,最终得出5个维度的要素群,即道德力(morals ability)、思维力(thinking ability)、沟通力(communicat1n ability)、学习力(learning ability)、实践力(practice ability),并将这5个要素群分解为“理想信念” “职业精神”等15个特征和41个项目,从而构建中医学“卓越医生”胜任力的“5A”模型。
[0037]以上显示和描述了本发明的基本原理和主要特征及本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
【权利要求】
1.一种用于医生胜任力模型构建的数据处理方法,其特征在于,包括以下步骤: (1)数据筛选:先后使用KMO数据值、巴菲力特球形检验数据对源数据进行筛选,选取KMO数据值大于0.5和巴菲力特球形检验数据小于0.05的数据为有效数据,其余数据为无效数据; (2)数据分解:将所有数据按照数据内容的不同分成若干个维度; (3)无效数据二次筛选:筛选出有效数据中每个数据维度的最大值和最小值,然后使用无效数据每个维度中的数据单元与相同维度中有效数据的最大值和最小值进行比较,若无效数据中的数据单元位于有效数据的最大值和最小值之间,则将这一无效数据中这一维度的数据单元标记为有效数据单元,否则,继续标记为无效数据单元; (4)有效数据单元的二次融合:计算每个有效数据各维度的平均值,然后将无效数据中标记为有效数据单元的数据代替相应维度的平均值,其它维度仍然使用本维度的平均值,形成一个新的有效数据单元,将所有新得到的有效数据单元使用第一加权因子进行加权处理后,融合入原有的有效数据单元中; (5)无效数据单元的处理:将步骤C中仍然标记为无效的数据单元按照维度的相关性进行重新排序,然后对各个维度进行权重排序,按照维度权重值由低到高的顺序依次选取各个维度的无效数据单元作为目标值对其相邻的无效数据单元进行线性拟合,拟合出的各个维度的数据组成的曲面作为医生胜任力模型构建的二次检查标准。
2.根据权利要求1所述的用于医生胜任力模型构建的数据处理方法,其特征在于:步骤(4)中,第一加权因子的计算公式为:
ο
3.根据权利要求1所述的用于医生胜任力模型构建的数据处理方法,其特征在于:步骤(4)中,将融合后形成的新的有效数据再次进行步骤(I)中的筛选过程,如果符合步骤(I)中的标准,则无需追加处理,如果不符合步骤(I)中的标准,则对第一加权因子进行调整,直至新的有效数据符合步骤(I)的标准。
4.根据权利要求3所述的用于医生胜任力模型构建的数据处理方法,其特征在于:对第一加权因子进行调整的步骤为:选取第一加权因子的I %作为迭代步长,任意选取正向或负向迭代,通过迭代前后的结果变化率和迭代结果与目标结果差值的绝对值的计算,确定下一次迭代变化量,其关系为,
q = D/k0
【文档编号】G06F17/30GK104239504SQ201410465407
【公开日】2014年12月24日 申请日期:2014年9月15日 优先权日:2014年9月15日
【发明者】金阿宁 申请人:金阿宁