本发明涉及医疗数据录入,具体为基于图像识别算法的医学检验数据录入方法。
背景技术:
1、医学检验,也称为医学检验或临床检验,是医学领域中不可或缺的一部分,它主要通过对人体血液、体液、排泄物及组织细胞等标本进行生物学、微生物学、免疫学、化学、血液学、生化、遗传学及细胞学等方面的检验,为疾病的预防、诊断、治疗及预后评估提供重要依据。通过准确的检验结果,医生能够更准确地了解患者的病情,制定更合理的治疗方案,从而提高治疗效果和患者的生活质量。同时,医学检验也为疾病的预防和控制提供了重要依据。
2、在申请公布号为cn115171837a的中国发明专利中,公开了一种检查报告的影像数据录入方法和装置,其中方法包括:在检查报告录入过程中,接收用户的影像数据区域选择指令;所述影像数据区域选择指令用于对影像切面图中待读取的目标影像数据所在区域进行设置;对所述影像数据区域选择指令指示的所述区域进行剪裁;对所述剪裁得到的图像进行文本识别处理,得到所述目标影像数据;在检查报告编辑界面中,将所述目标影像数据,填充至当前检查报告模板中的相应数据单元。采用本技术,可以有效提高医学检查报告生成时影像数据录入的便捷性、效率和准确性。
3、为了提高信息传递效率,改善患者医疗体验、加快患者的信息录入,在手动输入之外,还通常会借助图像识别技术,使用图像识别的录入方法是指利用图像识别技术,将图片中的信息自动识别并录入到计算机系统中,这种方法可以大大减少人工录入的工作量,提高数据录入的效率和准确性。但是在疫情集中爆发期或者甲流传播期,医院的患者众多,医生在诊断前后会有大量的医疗检验检验数据需要向系统中录入,例如各种检验数据、图像表格等,而一旦数据录入的工作量过大,就难免会导致将信息录错,降低工作效率,产生不必要的医患风险。
4、为此,本发明提供了基于图像识别算法的医学检验数据录入方法。
技术实现思路
1、(一)解决的技术问题
2、针对现有技术的不足,本发明提供了基于图像识别算法的医学检验数据录入方法,通过将若干个新区域图像拼接为修正图像,以修正图像库中的修正图像作为输入,使用训练好的图像标注模型生成对应的检验描述,并使用训练后的lda主题提取模型提取检验描述的主题词;由录入优先数据集合生成优先级系数,依据优先级系数依次录入数据描述、影像描述及图表描述;依据错误信息建立录入错误数据集合,由录入错误数据集合生成错误系数,当错误系数大于阈值时,向外部发出提示信息。在使用图像识别的基础上有序地进行信息录入,提高信息录入的效率和可靠性,从而解决了背景技术提出的技术问题。
3、(二)技术方案
4、为实现以上目的,本发明通过以下技术方案予以实现:基于图像识别算法的医学检验数据录入方法,包括,核验管理人员身份信息后,重复采集记载有医学检验数据的图像信息,依据采集图像的类别分别构建采集图像数据集合;
5、从采集图像数据集中获取区域图像并进行分割,对覆盖区域相同的不同子区块进行质量分析,将其中高质量子区块标记为待选子区块,将若干个待选子区块拼接形成新区域图像,汇总后建立新区域图像集合;
6、将若干个新区域图像拼接为修正图像,以修正图像库中的修正图像作为输入,使用训练好的图像标注模型生成对应的检验描述,并使用训练后的lda主题提取模型提取检验描述的主题词;其中,检验描述包括数据描述、影像描述及图表描述;
7、分别对数据描述、影像描述及图表描述的信息量分析并建立录入优先数据集合;由录入优先数据集合生成优先级系数yxj,依据优先级系数yxj依次录入数据描述、影像描述及图表描述;
8、对录入信息的语法和结构进行分析,若存在错误标注,依据错误信息建立录入错误数据集合,由录入错误数据集合生成错误系数cxs,当错误系数cxs大于阈值时,向外部发出提示信息。
9、进一步的,由图像采集装置,例如说相机或者扫描仪,对患者的医学检验信息进行采集,包括:记载有医学检验数据的医学检验单、可视化图表及检验影像信息;
10、依次对医学检验信息进行初步图像采集,输出整体图像;确定最小采样单位并依据医学检验信息与最小采样单位的倍数关系确定图像采集次数;在图像采集时,使相邻的采样图像存在部分重合,获取的图像均记录为区域图像。
11、进一步的,对医学检验信息进行一次或者多次图像采集,获取到区域图像信息并分别进行归类,并依据采集的批次进行标记和排序;对同一批次采集,位置相邻且存在重合的区域进行标记,对不同批次且指代同一区域的区域图像进行编号,依据采集区域图像的类别,分别构建采集图像数据集合。
12、进一步的,从采集图像数据集中获取采集到的区域图像,将不同批次的区域图像等面积地分割为若干个子区块,对若干个子区块进行标记和编号,对各个子区块进行图像质量分析,分别采集子区块的亮度、对比度及分辨率,汇总形成图像质量数据集合;
13、获取图像质量数据集合中的数据,对各个子区块的亮度ld、对比度db及分辨率fb进行无量纲处理后,参考如下公式关联形成质量评价值qts:
14、
15、参数意义为:亮度因子ρ1,0.40≤ρ1≤0.78,对比度因子ρ2,0.26≤ρ2≤0.86,分辨率因子ρ3,0.36≤ρ3≤0.86,c1为常数修正系数。
16、进一步的,对覆盖区域相同的不同子区块的质量评价值qts进行排序,并确定出其中质量评价值qts最大的子区块并标记为待选子区块;对若干个待选子区块拼接形成新区域图像,将同一类别的新区域图像汇总后建立新区域图像集合;在确定待选子区块后,完成拼接并形成新区域图像,对原图像进行修正,提高图像质量。
17、进一步的,在相邻两个新区域图像存在重合时,将两个新区域图像中质量评价值qts较低的重合区域剪除,依据医学检验信息整体图像作参考,在去除重叠部分后,将若干个新区域图像拼接为修正图像,汇总并分别构建修正图像库。
18、进一步的,以修正图像库中的修正图像作为输入,提取其特征向量,使用训练好的图像标注模型生成对应的自然语言描述,输出检验描述,包括数据描述、影像描述及图表描述;
19、使用lda主题提取模型提取数据描述、影像描述及图表描述的主题词;并依据训练后的相似度模型判断数据描述、影像描述及图表描述的主题词的相似性,输出主题相似度;在主题相似度低于相似度阈值时,向外部发出提醒。
20、进一步的,分别获取数据描述、影像描述及图表描述的包含内容的字节量,主题词出现次数,建立录入优先数据集合;由录入优先数据集合生成优先级系数yxj,其中,对获取主题次数zt及字节量zj后做无量纲处理,依照如下方式:
21、
22、参数的意义为:0≤α≤1,0≤β≤1,c2为常数修正系数;
23、分别获取数据描述、影像描述及图表描述的优先级系数yxj,并依据优先级系数yxj的值的大小进行排序获取优先级顺序,依照优先级顺序录入数据描述、影像描述及图表描述,完成医学检验数据的录入。
24、进一步的,使用自然语言处理算法训练后的结构分析模型,对录入信息的语法和结构进行分析,输出分析结果;若存在错误,由结构分析模型对录入信息进行标注;
25、依据对错误的标注判断产生的错误的字节长度,以字节长度为错误的面积mj,检索出与该处错误距离最近的主题词,将主题词与该错误间的距离输出,形成错误的距离cl,并且确定该主题词的出现频次pc,将面积mj、频次pc及距离cl汇总后形成建立录入错误数据集合。
26、进一步的,由录入错误数据集合生成错误系数cxs,其中,将面积mj、频次pc及距离cl无量纲处理后,依照如下公式:
27、
28、其中,0.25≤δ≤0.89,0.21≤θ≤0.98,且δ+θ=1,δ、θ为权重,其具体值由用户调整设置,r为面积mj与频次pc之间的相关性系数。
29、优选的,
30、(三)有益效果
31、本发明提供了基于图像识别算法的医学检验数据录入方法,具备以下有益效果:
32、1、对图像采集人员的身份进行核验,维持信息录入的安全性;通过展开重复的区域采样,在存在若干个采样时,可以使用图像质量进行筛选和替换,对图像质量形成保障,在识别信息和信息录入时,保障信息录入的安全性。
33、2、依据形成的质量评价值qts,对子区块的图像质量形成评价,依据评价的结果能够从若干个子区块中选择出图像质量最好的部分,以对质量不佳的部分进行替换。
34、3、依据质量评价值qts筛选出待选子区块,将若干待选子区块拼接后会形成新区域图像,完成区域图像修正和重组,而新区域图像相对于原区域图像的图像质量更好,在进行图像识别时识别的效果更好,保证了文字信息识别的准确性;在当前某个子区块的图像质量难以满足当前的图像识别需求时,也能够对其进行替换,或者,能用于重复识别以取得最佳的识别效果,保障识别及信息录入的完成。
35、4、在将若干个新区域图像拼接为修正图像的基础上,对信息提取的准确度进行了保障,若信息提取不够准确,还能够对子区块进行替换,重复识别以保障识别效果;使用主题相似度能够对数据描述、影像描述及图表描述间的对应性进行判断,在患者医学检验信息录入的准确性的基础上,进一步保障医学检验及相关数据录入的准确性。
36、5、依据形成的优先级系数yxj对患者的数据描述、影像描述及图表描述的输入顺序形成限定,在使用图像识别的基础上有序地进行信息录入,在当前较忙且患者较多时,可以提高信息录入的效率和可靠性。
37、6、在核对了特定指示语对管理员的身份进行确认后,使用结构分析模型继续对完成录入的医学检验信息进行核验,若存在错误,对需要进行修改的部分进行标记,必要时进行修改,从而在语义上保证信息录入的准确性,最终使录入信息与实际的医学检验信息相对应。