曲线中数据的还原方法、装置、存储介质、电子设备与流程

文档序号:21638672发布日期:2020-07-29 02:49阅读:308来源:国知局
曲线中数据的还原方法、装置、存储介质、电子设备与流程

本发明实施例涉及数据处理技术领域,尤其涉及一种曲线中数据的还原方法、装置、存储介质、电子设备。



背景技术:

曲线,是指动点运动时,方向连续变化所形成的线,也可以想象成弯曲的波状线。现实生活中,在某些特殊场景下,某些报告中经常存在曲线。例如,在医学报告中,针对患者肺通气功能描述的一些曲线。对于这类报告中的曲线,由于曲线中异常值的存在,对于报告的准确性存在影响,因此需要对曲线中数据进行还原,以便于剔除异常值,如此对数据进行平滑处理,从而重塑该曲线。



技术实现要素:

鉴于此,为解决上述技术问题或部分技术问题,本发明实施例提供了一种曲线中数据的还原方法、装置、存储介质、电子设备。

第一方面,本发明实施例提供了一种曲线中数据的还原方法,所述方法包括:

获取目标报告文档,解析所述目标报告文档中携带的文字要素以及曲线要素;

将所述文字要素存储至文字数组文件中,将所述曲线要素存储至曲线数组文件中;

确定所述目标报告文档中目标曲线,并基于所述文字数组文件以及所述曲线数组文件,确定所述目标曲线的目标原点;

基于所述目标原点以及所述文字数组文件,确定所述目标曲线中数据;

按照预设的分割规则,对所述目标曲线中数据进行分割,以实现对所述目标曲线中数据的还原。

在一个可选的实施方式中,所述解析所述目标报告文档中携带的文字要素以及曲线要素,包括:

利用文档矢量元素解析技术,解析所述目标报告文档中携带的文字要素以及曲线要素。

在一个可选的实施方式中,所述确定所述目标报告文档中目标曲线,包括:

确定曲线颜色;

根据所述曲线颜色,确定所述目标报告文档中目标曲线。

在一个可选的实施方式中,所述基于所述文字数组文件以及所述曲线数组文件,确定所述目标曲线的目标原点,包括:

针对所述曲线数组文件,提取所述目标报告文档中目标区域出现的两两交叉竖线组;

将所述两两交叉竖线组的交叉点组成疑似目标曲线的原点集合;

针对所述文字数组文件,提取数值为零的第一数组元素;

以所述第一数组元素的位置为基准,计算所述疑似目标曲线的原点集合中与所述第一数组元素距离最近的原点;

确定所述原点为目标曲线的目标原点。

在一个可选的实施方式中,所述基于所述目标原点以及所述文字数组文件,确定所述目标曲线中数据,包括:

根据所述目标原点确定所述目标曲线所在的区域范围,其中,所述区域范围包括横坐标最大坐标以及纵坐标最大坐标;

从所述文字数组文件中提取距离所述横坐标最大坐标距离最近的第二数组元素;

从所述文字数组文件中提取距离所述纵坐标最大坐标距离最近的第三数组元素;

基于所述第二数组元素、所述第三数组元素以及目标曲线中任一曲线点,确定所述目标曲线中数据。

在一个可选的实施方式中,所述基于所述第二数组元素、所述第三数组元素以及目标曲线中任一曲线点,确定所述目标曲线中数据,包括:

将所述第二数组元素、所述第三数组元素以及目标曲线中任一曲线点,输入至数据计算公式确定所述目标曲线中数据;

其中,所述数据计算公式包括:

x_i=x_i*x_m/x_max;

y_i=y_i*y_m/y_max;

由(x_i,y_i)组成所述目标曲线中数据,由(x_i,y_i)组成所述目标曲线中任一曲线点,所述x_m为所述第二数组元素,所述y_m为所述第三数组元素,由(0,x_max)组成所述横坐标最大坐标,由(0,y_max)组成所述纵坐标最大坐标。

在一个可选的实施方式中,所述方法还包括:

利用线性插值方法,对所述目标曲线中数据进行分割得到的原始结果进行线性插值,以完成对稀疏点集的填充。

第二方面,本发明实施例提供一种曲线中数据的还原装置,所述装置包括:

文档获取模块,用于获取目标报告文档,解析所述目标报告文档中携带的文字要素以及曲线要素;

要素存储模块,用于将所述文字要素存储至文字数组文件中,将所述曲线要素存储至曲线数组文件中;

原点确定模块,用于确定所述目标报告文档中目标曲线,并基于所述文字数组文件以及所述曲线数组文件,确定所述目标曲线的目标原点;

数据确定模块,用于基于所述目标原点以及所述文字数组文件,确定所述目标曲线中数据;

数据分割模块,用于按照预设的分割规则,对所述目标曲线中数据进行分割,以实现对所述目标曲线中数据的还原。

第三方面,本发明实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现前述的曲线中数据的还原方法。

第四方面,本发明实施例提供一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的曲线中数据的还原程序,以实现前述的曲线中数据的还原方法。

本发明实施例提供的技术方案,通过获取目标报告文档,解析该目标报告文档中携带的文字要素以及曲线要素,并将文字要素存储至文字数组文件中,将曲线要素存储至曲线数组文件中,确定目标报告文档中目标曲线,并基于文字数组文件以及曲线数组文件,确定目标曲线的目标原点,基于目标原点以及文字数组文件,确定目标曲线中数据,按照预设的分割规则,对目标曲线中数据进行分割,以实现对目标曲线中数据的还原。如此可以实现对曲线中数据的还原,便于剔除异常值,对数据进行平滑处理,从而重塑该曲线。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。

图1为本发明实施例示出的一种曲线中数据的还原方法的实施流程示意图;

图2为本发明实施例示出的一种曲线中数据的还原装置的结构示意图;

图3为本发明实施例的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。

如图1所示,为本发明实施例提供的一种曲线中数据的还原方法的实施流程示意图,该方法具体可以包括以下步骤:

s101,获取目标报告文档,解析所述目标报告文档中携带的文字要素以及曲线要素;

在本发明实施例中,可以获取目标报告文档,该目标报告文档,例如可以患者肺通气功能检查报告文档,例如可以是支气管扩张试验检查报告文档,这类报告文档中包含相应的对于患者肺通气功能进行描述的曲线,对于支气管扩张试验进行描述的曲线。

对于上述获取的目标报告文档,本发明实施例可以解析该目标报告文档中携带的文字要素以及曲线要素,当然还可以包括其它文档要素,例如图像要素,本发明实施例对此不作限定。

具体地,本发明实施例可以利用文档矢量元素解析技术,解析所述目标报告文档中携带的文字要素以及曲线要素。

例如,对于患者肺通气功能检查报告文档,本发明实施例可以利用文档矢量元素解析技术,解析该患者肺通气功能检查报告文档中携带的文字要素、图像要素以及曲线要素。

s102,将所述文字要素存储至文字数组文件中,将所述曲线要素存储至曲线数组文件中;

对于上述解析得到的文字要素、图像要素以及曲线要素,本发明实施例将所述文字要素存储至文字数组文件中,将所述图像要素存储至图像数组文件中,将所述曲线要素存储至曲线数组文件中。

s103,确定所述目标报告文档中目标曲线,并基于所述文字数组文件以及所述曲线数组文件,确定所述目标曲线的目标原点;

对于目标报告文档中曲线,因颜色存在差异,本发明实施例可以基于曲线颜色确定所述目标报告文档中目标曲线。

例如,本发明实施例确定曲线颜色:红色,基于该曲线颜色,确定所述目标报告文档中目标曲线。

另外,基于所述文字数组文件以及所述曲线数组文件,确定所述目标曲线的目标原点,具体实现方式如下所示:

针对所述曲线数组文件,提取所述目标报告文档中目标区域出现的两两交叉竖线组;将所述两两交叉竖线组的交叉点组成疑似目标曲线的原点集合;针对所述文字数组文件,提取数值为零的第一数组元素;以所述第一数组元素的位置为基准,计算所述疑似目标曲线的原点集合中与所述第一数组元素距离最近的原点;确定所述原点为目标曲线的目标原点。

其中,对于目标区域,根据先验信息,可以是目标报告文档中左侧区域。

例如,针对所述曲线数组文件,提取所述目标报告文档中左侧区域出现的两两交叉竖线组,将所述两两交叉竖线组的交叉点组成疑似目标曲线的原点集合;

针对所述文字数组文件,提取数值为0的数组元素,以该数值为0的数组元素的位置为基准,计算所述疑似目标曲线的原点集合中与该数值为0的数组元素距离最近的原点,并确定所述原点为目标曲线的目标原点。

s104,基于所述目标原点以及所述文字数组文件,确定所述目标曲线中数据;

对于上述目标原点以及上述文字数组文件,本发明实施例可以基于上述目标原点以及上述文字数组文件,确定所述目标曲线中数据,具体实现方式如下所示:

根据所述目标原点确定所述目标曲线所在的区域范围,其中,所述区域范围包括横坐标最大坐标以及纵坐标最大坐标;从所述文字数组文件中提取距离所述横坐标最大坐标距离最近的第二数组元素;从所述文字数组文件中提取距离所述纵坐标最大坐标距离最近的第三数组元素;基于所述第二数组元素、所述第三数组元素以及目标曲线中任一曲线点,确定所述目标曲线中数据。

例如,根据所述目标原点确定的横竖交叉线段的最大值、最小值,确定所述目标曲线所在的区域范围,所述区域范围包括横坐标最大坐标(0,x_max)以及纵坐标最大坐标(0,y_max);

从所述文字数组文件中提取距离所述横坐标(0,x_max)最大坐标距离最近的数组元素x_m,从所述文字数组文件中提取距离所述纵坐标最大坐标(0,y_max)距离最近的数组元素y_m;

对于目标曲线中任一曲线点(x_i,y_i),基于所述第二数组元素、所述第三数组元素以及目标曲线中任一曲线点,确定所述目标曲线中数据。

具体地,将所述第二数组元素、所述第三数组元素以及目标曲线中任一曲线点,输入至数据计算公式确定所述目标曲线中数据。

其中,所述数据计算公式包括:

x_i=x_i*x_m/x_max;

y_i=y_i*y_m/y_max;

由(x_i,y_i)组成所述目标曲线中数据,由(x_i,y_i)组成所述目标曲线中任一曲线点,所述x_m为所述第二数组元素,所述y_m为所述第三数组元素,由(0,x_max)组成所述横坐标最大坐标,由(0,y_max)组成所述纵坐标最大坐标。

s105,按照预设的分割规则,对所述目标曲线中数据进行分割,以实现对所述目标曲线中数据的还原。

对于上述得到的目标曲线中数据,本发明实施例按照预设的分割规则,对所述目标曲线中数据进行分割,以实现对所述目标曲线中数据的还原。

具体地,根据这些曲线均从原点出发以及变化趋势均为x轴方向单调递增的规律,本发明实施例提出基于趋势分析的目标曲线分割技术,通过判断目标区域内原点出发的曲线是否为x轴方向单调递增,对目标曲线进行分割,如此分割结果即为所提取到的原始曲线中数据。

另外,对于对目标曲线中数据进行分割得到的原始结果,本发明实施例利用线性插值方法,对所述目标曲线中数据进行分割得到的原始结果进行线性插值,以完成对稀疏点集的填充。

通过上述对本发明实施例提供的技术方案的描述,通过获取目标报告文档,解析该目标报告文档中携带的文字要素以及曲线要素,并将文字要素存储至文字数组文件中,将曲线要素存储至曲线数组文件中,确定目标报告文档中目标曲线,并基于文字数组文件以及曲线数组文件,确定目标曲线的目标原点,基于目标原点以及文字数组文件,确定目标曲线中数据,按照预设的分割规则,对目标曲线中数据进行分割,以实现对目标曲线中数据的还原。如此可以实现对曲线中数据的还原,便于剔除异常值,对数据进行平滑处理,从而重塑该曲线。

相对于方法实施例,本发明实施例还提供了一种曲线中数据的还原装置的实施例,如图2所示,该装置可以包括:文档获取模块210、要素存储模块220、原点确定模块230、数据确定模块240、数据分割模块250。

文档获取模块210,用于获取目标报告文档,解析所述目标报告文档中携带的文字要素以及曲线要素;

要素存储模块220,用于将所述文字要素存储至文字数组文件中,将所述曲线要素存储至曲线数组文件中;

原点确定模块230,用于确定所述目标报告文档中目标曲线,并基于所述文字数组文件以及所述曲线数组文件,确定所述目标曲线的目标原点;

数据确定模块240,用于基于所述目标原点以及所述文字数组文件,确定所述目标曲线中数据;

数据分割模块250,用于按照预设的分割规则,对所述目标曲线中数据进行分割,以实现对所述目标曲线中数据的还原。

图3为本发明实施例提供的一种的电子设备的结构示意图,图3所示的电子设备300包括:至少一个处理器301、存储器302、至少一个网络接口304和其他用户接口303。移动终端300中的各个组件通过总线系统305耦合在一起。可理解,总线系统305用于实现这些组件之间的连接通信。总线系统305除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图3中将各种总线都标为总线系统305。

其中,用户接口303可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。

可以理解,本发明实施例中的存储器302可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-onlymemory,rom)、可编程只读存储器(programmablerom,prom)、可擦除可编程只读存储器(erasableprom,eprom)、电可擦除可编程只读存储器(electricallyeprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(randomaccessmemory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(staticram,sram)、动态随机存取存储器(dynamicram,dram)、同步动态随机存取存储器(synchronousdram,sdram)、双倍数据速率同步动态随机存取存储器(doubledataratesdram,ddrsdram)、增强型同步动态随机存取存储器(enhancedsdram,esdram)、同步连接动态随机存取存储器(synchlinkdram,sldram)和直接内存总线随机存取存储器(directrambusram,drram)。本文描述的存储器302旨在包括但不限于这些和任意其它适合类型的存储器。

在一些实施方式中,存储器302存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统3021和应用程序3022。

其中,操作系统3021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序3022,包含各种应用程序,例如媒体播放器(mediaplayer)、浏览器(browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序3022中。

在本发明实施例中,通过调用存储器302存储的程序或指令,具体的,可以是应用程序3022中存储的程序或指令,处理器301用于执行各方法实施例所提供的方法步骤,例如包括:获取目标报告文档,解析所述目标报告文档中携带的文字要素以及曲线要素;将所述文字要素存储至文字数组文件中,将所述曲线要素存储至曲线数组文件中;确定所述目标报告文档中目标曲线,并基于所述文字数组文件以及所述曲线数组文件,确定所述目标曲线的目标原点;基于所述目标原点以及所述文字数组文件,确定所述目标曲线中数据;按照预设的分割规则,对所述目标曲线中数据进行分割,以实现对所述目标曲线中数据的还原。

上述本发明实施例揭示的方法可以应用于处理器301中,或者由处理器301实现。处理器301可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器301中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器301可以是通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器302,处理器301读取存储器302中的信息,结合其硬件完成上述方法的步骤。

可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(applicationspecificintegratedcircuits,asic)、数字信号处理器(digitalsignalprocessing,dsp)、数字信号处理设备(dspdevice,dspd)、可编程逻辑设备(programmablelogicdevice,pld)、现场可编程门阵列(field-programmablegatearray,fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

本实施例提供的电子设备可以是如图3中所示的电子设备,可执行如图1中曲线中数据的还原方法的所有步骤,进而实现图1所示曲线中数据的还原方法的技术效果,具体请参照图1相关描述,为简洁描述,在此不作赘述。

本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。

当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在曲线中数据的还原设备侧执行的曲线中数据的还原方法。

所述处理器用于执行存储器中存储的曲线中数据的还原程序,以实现以下在曲线中数据的还原设备侧执行的曲线中数据的还原方法的步骤:

获取目标报告文档,解析所述目标报告文档中携带的文字要素以及曲线要素;将所述文字要素存储至文字数组文件中,将所述曲线要素存储至曲线数组文件中;确定所述目标报告文档中目标曲线,并基于所述文字数组文件以及所述曲线数组文件,确定所述目标曲线的目标原点;基于所述目标原点以及所述文字数组文件,确定所述目标曲线中数据;按照预设的分割规则,对所述目标曲线中数据进行分割,以实现对所述目标曲线中数据的还原。

专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1