一种临床试验方案的信息提取方法与流程

文档序号:41128033发布日期:2025-03-04 16:56阅读:2来源:国知局
一种临床试验方案的信息提取方法与流程

本发明涉及临床试验信息提取,具体为一种临床试验方案的信息提取方法。


背景技术:

1、临床试验方案是对临床试验全过程的系统描述,旨在指导研究人员如何进行一项具体的临床试验,它通常包括试验的背景、目的、设计、方法、受试者特征、样本量、主要和次要终点,以及统计分析方法等详细信息,临床试验方案是确保试验科学性、伦理性和可重复性的重要文档,临床试验信息的提取有助于提高研究的透明度,确保试验结果能够被其他研究者验证和重复,这对于科学研究甚至审查新药和疗法的安全性及有效性至关重要,提取不同试验的关键数据为进行系统评价和荟萃分析提供了必要的基础,这样可以整合多项试验的证据,增加结果的统计权威性,同时医疗决策者、临床医生及患者可以通过临床试验方案中的数据了解新的治疗方案的预期效果和风险,帮助他们做出知情的决策。

2、目前进行临床试验方案的信息提取时,主要聚焦于单一数据来源且没有系统性收集数据,在进行信息提取时信息数据缺乏准确性与可靠性。


技术实现思路

1、(一)解决的技术问题

2、针对现有技术的不足,本发明提供了一种临床试验方案的信息提取方法,具备通过收集临床试验方案文件、注册信息、研究论文以及相关文献,整理数据,形成电子数据库,使用文本挖掘技术和自然语言处理工具,对收集到的文献进行分析并标注关键信息,包括试验的目的、设计、方法、受试者特征、样本量、主要与次要终点以及统计方法,并计算随机对照试验设计类型比例与开放标签设计类型比例,将标注好的数据提取到电子表格中,试验组与对照组的信息进行分离,对提取的数据进行核对,实施双重检查,计算核对过程中的一致性比例与错误率,根据提取的数据进行统计分析,进行样本特征描述,计算均值、标准差、置信区间、提取数据的最小值与最大值以及组合终点的合并效果量,将分析结果整理成报告,包括试验设计的详细描述,关键结果与结论,使用图表和图形进行展示,通过从原始文献、注册信息、研究论文等多样化来源全面收集数据,并形成电子数据库,结合文本挖掘和自然语言处理技术,进行文献分析和关键信息的自动标注,提取信息,并进行双重检查,提升了信息提取的准确性与可靠性等优点,解决了上述问题。

3、(二)技术方案

4、为实现上述目的,本发明提供如下技术方案:一种临床试验方案的信息提取方法,包括以下步骤:

5、s1、收集临床试验方案文件、注册信息、研究论文以及相关文献,整理数据,形成电子数据库;

6、s2、使用文本挖掘技术和自然语言处理工具,对收集到的文献进行分析并标注关键信息,包括试验的目的、设计、方法、受试者特征、样本量、主要与次要终点以及统计方法,并计算随机对照试验设计类型比例与开放标签设计类型比例;

7、s3、将标注好的数据提取到电子表格中,试验组与对照组的信息进行分离;

8、s4、对提取的数据进行核对,实施双重检查,计算核对过程中的一致性比例与核对过程中的错误率;

9、s5、根据提取的数据进行统计分析,进行样本特征描述,计算均值、标准差、置信区间、提取数据的最小值与最大值以及组合终点的合并效果量;

10、s6、将分析结果整理成报告,报告包括试验设计的详细描述,关键结果与结论,使用图表和图形进行展示。

11、优选的,所述s2计算随机对照试验设计类型比例的公式如下所示:

12、

13、公式中,prct表示随机对照试验设计类型比例,nrct表示随机对照试验的数量,ntotal表示收集到的所有试验的总数量。

14、优选的,所述s2计算开放标签设计类型比例的公式如下所示:

15、

16、公式中,popen表示开放标签设计类型比例,nopen表示开放标签设计的数量,ntotal表示收集到的所有试验的总数量。

17、优选的,所述s4计算核对过程中的一致性比例,计算公式如下所示:

18、

19、公式中,ca表示核对过程中的一致性比例,nyz表示在双重检查中一致性检验通过的数量,ncheck表示被双重检查的数量。

20、优选的,所述s4计算核对过程中的错误率,公式如下所示:

21、

22、公式中,et表示错误率,ner表示在双重检查中发现的错误数量,ncheck表示被双重检查的数量。

23、优选的,所述s5计算样本特征均值,公式如下所示:

24、

25、公式中,表示样本特征均值,n表示样本量,xti表示第i个样本值,i表示计数下标。

26、优选的,所述s5计算样本特征标准差,公式如下所示:

27、

28、公式中,st表示样本特征标准差,表示均值,n表示样本量,xti表示第i个样本值,i表示计数下标。

29、优选的,所述s5计算置信区间,公式如下所示:

30、

31、公式中,ci表示置信区间,表示均值,n表示样本量,st表示标准差,表示t分布的临界值,t取值范围在(0-1)。

32、优选的,所述s5计算提取数据的最小值与最大值,公式如下所示:

33、zxmin=min(xt1,xt2,..,xtm)

34、zxmax=max(xt1,xt2,..,xtm)

35、公式中,zxmin与zxmax表示提取数据的最小值与最大值,xt1,xt2,..,xtm表示选取的m个样本数据。

36、优选的,所述s5计算组合终点的合并效果量,公式如下所示:

37、

38、公式中,es表示组合终点的合并效果量,与分别表示试验组和对照组的均值,stsy与stdz分别表示试验组和对照组的标准差,n1与n2分别表示试验组和对照组的样本量。

39、与现有技术相比,本发明提供了一种临床试验方案的信息提取方法,具备以下有益效果:

40、本发明通过收集临床试验方案文件、注册信息、研究论文以及相关文献,整理数据,形成电子数据库,使用文本挖掘技术和自然语言处理工具,对收集到的文献进行分析并标注关键信息,包括试验的目的、设计、方法、受试者特征、样本量、主要与次要终点以及统计方法,并计算随机对照试验设计类型比例与开放标签设计类型比例,将标注好的数据提取到电子表格中,试验组与对照组的信息进行分离,对提取的数据进行核对,实施双重检查,计算核对过程中的一致性比例与错误率,根据提取的数据进行统计分析,进行样本特征描述,计算均值、标准差、置信区间、提取数据的最小值与最大值以及组合终点的合并效果量,将分析结果整理成报告,包括试验设计的详细描述,关键结果与结论,使用图表和图形进行展示,通过从原始文献、注册信息、研究论文等多样化来源全面收集数据,并形成电子数据库,结合文本挖掘和自然语言处理技术,进行文献分析和关键信息的自动标注,提取信息,并进行双重检查,提升了信息提取的准确性与可靠性。



技术特征:

1.一种临床试验方案的信息提取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种临床试验方案的信息提取方法,其特征在于:所述s2计算随机对照试验设计类型比例的公式如下所示:

3.根据权利要求2所述的一种临床试验方案的信息提取方法,其特征在于:所述s2计算开放标签设计类型比例的公式如下所示:

4.根据权利要求3所述的一种临床试验方案的信息提取方法,其特征在于:所述s4计算核对过程中的一致性比例,计算公式如下所示:

5.根据权利要求1所述的一种临床试验方案的信息提取方法,其特征在于:所述s4计算核对过程中的错误率,公式如下所示:

6.根据权利要求5所述的一种临床试验方案的信息提取方法,其特征在于:所述s5计算样本特征均值,公式如下所示:

7.根据权利要求6所述的一种临床试验方案的信息提取方法,其特征在于:所述s5计算样本特征标准差,公式如下所示:

8.根据权利要求7所述的一种临床试验方案的信息提取方法,其特征在于:所述s5计算置信区间,公式如下所示:

9.根据权利要求8所述的一种临床试验方案的信息提取方法,其特征在于:所述s5计算提取数据的最小值与最大值,公式如下所示:

10.根据权利要求9所述的一种临床试验方案的信息提取方法,其特征在于:所述s5计算组合终点的合并效果量,公式如下所示:


技术总结
本发明涉及临床试验信息提取技术领域,且公开了一种临床试验方案的信息提取方法。该方法通过收集临床试验方案文件、注册信息、研究论文以及相关文献,整理数据,形成电子数据库,使用文本挖掘技术和自然语言处理工具,对收集到的文献进行分析,标注关键信息,并计算随机对照试验设计类型比例与开放标签设计类型比例,将标注好的数据提取到电子表格中,对提取的数据进行核对,实施双重检查,计算核对过程中的一致性比例与错误率,根据提取的数据进行统计分析,计算均值、标准差、置信区间、提取数据的最小值与最大值以及组合终点的合并效果量,将分析结果整理成报告,包括试验设计的详细描述,关键结果与结论,使用图表和图形进行展示。

技术研发人员:唐晓斌,牛艳,秦风云,樊文定,谌天娇,刘怡静,曹轲,李光辉,张孟丹,孙欢,张芮茗,胡静
受保护的技术使用者:河南华普医药科技有限公司
技术研发日:
技术公布日:2025/3/3
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1