一种非线性剂量-效应曲线的批量拟合方法

文档序号:9751082阅读:1327来源:国知局
一种非线性剂量-效应曲线的批量拟合方法
【技术领域】
[0001] 本发明属于化学品毒性测试中剂量-效应曲线分析领域,具体涉及针对大批量剂 量-效应关系数据集的非线性单调与非线性非单调剂量-效应函数的批量拟合方法。
【背景技术】
[0002] 剂量(浓度)-效应关系是毒理学的重要概念,指随着外源化合物的浓度增加,对机 体的毒效应的程度增加,或出现某种效应的个体在群体中所占的比例增加,剂量(浓度)_效 应关系反映了人体或实验动物对外源化学物毒性作用易感性的分布。浓度-效应关系可用 浓度效应曲线来表示,即用效应强弱表示纵坐标,毒物浓度为横坐标,绘制散点图所得的曲 线。由于不同毒物在不同条件下引起的效应类型不同,会导致浓度与效应的相关关系不一 致。因此,会呈现出不同的浓度-效应曲线类型。非线性剂量-效应关系普遍存在于自然界, 根据剂量与效应是否呈单调关系,有单调S型曲线和非单调倒U型、J型曲线之分。单调剂量-效应曲线的特点是在低浓度范围内,随着浓度增加,效应增加较为缓慢,然后浓度增加时, 效应也随之急速增加,但当浓度继续增加时,效应应强度增加又趋向缓慢。曲线开始平缓, 继之陡峭,然后又趋平缓,成为S型。非单调剂量-效应曲线特点是低剂量刺激,高剂量抑制, 即Hormesis效应。
[0003] 传统化学品毒性测试方法周期长,获取的数据量少。数据分析过程中,研究人员通 常将剂量-效应数据输入或拷贝至一些专业的数据统计软件如SPSS、Origin、GraphPad、DPS 等进行拟合。非线性拟合过程需要:1)依据剂量-效应数据的变化趋势选择相应函数形式; 2)提供函数中参数的初始值。剂量-效应数据拟合单调函数包括常用的Hill、Weibull、 Logit等十几组方程【Scholze M,Boedeker W,Faust M,Backhaus T,Altenburger R, Grimme LH.2001.A general best-fit method for concentration-response curves and the estimation of low-effect concentrations.Environ.Toxicol.Chem.20:448-457】【Sp iess A-N,Neumeyer N.An evaluation of R2as an inadequate measure for nonlinear models in pharmacological and biochemical research:A Monte Carlo approach.BMC Pharmacol.2010; 10:11.】。拟合非单调剂量-效应数据的函数也有多组例如 Brain-Consens和Biphasic函数【Zhu X_W,Liu S_S,Qin L_T,Chen F,Liu H-L.2013.Modeling non-monotonic dose-response relationships :Model evaluation and hormetic quantities exploration.Ecotoxicol .Environ.Saf .89:130-136]以及由 单调的Hill函数两两叠合产生的描述非单调数据的多相函数【Di Veroli GY,Fornari C, Goldlust I,Mills G,Koh SB,Bramhall JL,et al.2015.An automated fitting procedure and software for dose-response curves with multiphasic features. Sci .Rep. 5:14701 .】。目前,没有一种商业或开源软件涵盖了如此多的函数。以 Origin软件为例,拟合前需要将所选定函数式手工输入Origin软件中进行编译,编译通过 后方可进行下一步操作,往往需要选定多组函数进行拟合,然后从中选取最优者。此外拟合 前函数参数的初始值选择同样是一个难题,若参数初始值与最终拟合值相差不多,通过适 当迭代算法,可以找到参数最优拟合值,若相差较大,住住会导致非线性最小二乘方法寻找 最优参数值过程中产生奇异矩阵,导致方程拟合失败。研究人员通常依据此前的研究经验 或利用不断试错的方法选函数的初始值,然而对于实验中出现的新型剂量-效应数据,研究 人员提供的函数初始值往往会导致拟合失败。此前,研究人员做了大量工作,主要集中于利 用机器学习的方法如遗传算法寻找拟合方程参数的合适的初始值【任伯帜,锐龙腾 .2005.P-III型分布参数估计的改进混合遗传优化适线法.重庆大学学报(自然科学版)28: 82-85·】【Watkins P,Puxty G.2006.A hybrid genetic algorithm for estimating the equilibrium potential of an ion-selective electrode.Talanta 68:1336-1342;】 【Niazi A,Leardi R.2012.Genetic algorithms in chemometries .J.Chemom.26:345-351】。上述研究遗传算法寻找拟合参数初始值效应比较好,唯一不足之处是计算工作量大。
[0004] 随着美国环境保护局针对药品与个人护理品、工业化学品、农药等环境化学品的 风险评价发起ToxCast计算毒理学计划的发展,定量高通量筛选技术已经测定了上千种化 学物质对800多组实验体系的剂量-效应数据【Dix DJ,Houck KA,Martin MT,Richard AM, Setzer Rff,Kavlock RJ.2007. The ToxCast program for prioritizing toxicity testing of environmental chemicals·Toxicol·Sci·95:5-12】【Judson RS,Houck KA, Kavlock RJ,Knudsen TB,Martin MT,Mortensen HM,et al.2010.1 n Vitro Screening of Environmental Chemicals for Targeted Testing Prioritization: The ToxCast Project .Environ. Heal th Perspect. 118:485-492】。例如,截止至2013年12月份,已经得到 超过2百万条剂量-效应曲线。同时,其它的企业和实验室中利用定量高通量筛选技术也在 测定大量研究化学物质的剂量-效应数据。拟合如此海量的剂量-效应曲线,需要选择函数 并提供合适的参数初始值。因此,利用传统的人工的方式逐条拟合曲线显然已经不合适。
[0005] 大量的研究文献关注单条剂量-效应曲线的函数拟合【Di Veroli GY,Fornari C, Goldlust I,Mills G,Koh SB ,Bramhal1 JL,et al.2015.An automated fitting procedure and software for dose-response curves with multiphasic features. Sci. Rep. 5:14701】。对于混杂有单调与非单调高通量剂量-效应曲线的快速拟合 并从大量拟合函数中选取最优者,依然没有批量化与自动化的解决办法。多数研究集中于 非线性最小二乘算法的改进。例如很多研究采用最速下降法、牛顿下山法、线性搜索法、信 赖域算法等改进最优拟合参数搜索过程【Madsen K,Nielsen HB,Tingleff 0.2004.Methods for non-linear least squares problems . 2nd ed. Informatics and Mathematical Model ling, Technical University of Denmark,{DTU},Lyngby】,达到容忍 较差拟合初始值的目的。然而,这些方法在本质上并不能解决参数拟合初始值选择的问题。
[0006] 针对这一问题,通常需要人为尝试多组可能的拟合值组合,而人为的依据经验猜 测可能的初始值的方式效力低下且往往不正确。本发明是尝试利用计算机技术,通过程序 方法从构建的数据库读取初始值进行拟合,若拟合不成功,再快速读取下一条初始值进行 拟合,不断尝试,直至剂量-效应数据被成功拟合。我们把这一由计算机控制的高频试错的 拟合方式称
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1