徐 娟, 王 林编译
(军事医学科学院放射医学研究所, 北京 100850)
摘要: 计算机辅助药物设计是以计算机为工具,采用各种理论计算方法和分子模建技术,根据累积
的大量结构和功能信息,设计出具有一定药效的新分子。本文简要介绍基于结构与性质的药物设
计,以及定量参数、Hansch 模型、Free2Wilson 模型、神经网络、定量结构2性质关系、定量构效关系、定
量结构2代谢关系等内容。
要害词: 计算机辅助药物设计; 定量结构2性质关系; 定量构效关系; 定量结构2代谢关系
中图分类号: R914. 2 文献标识码: A 文章编号: 100120971 (2003) 0320135204
发现和开发一个新的化学实体(NCE) 并使之作
为新药推向市场是一个漫长、费力且昂贵的过程,因
为发现具有良好活性、选择性、稳定性和安全性的新
化合物的几率很低。根据目前估计,在30 000 个合
成化合物中,2 000 个可进入临床前研究,200 个可
进入Ⅰ期临床试验,40 个可进入Ⅱ期临床试验,12
个可进入Ⅲ期临床试验,8 个可被批准,仅有1 个在
投资上具有良好效益。因此,制药工业和药物开发
需要创新。计算机辅助药物设计(CADD) 利用了配
体与受体间相互作用原理,可提高新药开发效率,缩
短新药开发进程。运用计算机进行定量结构2性质
关系(QSPR) 、定量构效关系(QSAR) 和定量结构2代
谢关系(QSMR) 等的研究,可以快速筛选目标化合
物,从而有效节省因化学合成和体内外实验而耗费
的大量时间及资金。
1 计算机辅助药物设计
1. 1 基于结构的药物设计
众多蛋白的三维结构是已知的,可作为药物靶
标。运用计算机将这些靶标的结构与潜在的药物分
子进行比较,可描述其可能的相互作用。确定配体2
受体复合物结构,寻找所需化学结构和性质的先导
化合物,然后检测其活性即为基于结构的药物设计。
1. 2 基于性质的药物设计
寻找一个能选择性与靶标高亲和力结合的化合
物,并使其成为一个成功的药物很困难。大约40 %
的候选药物因为不适当的药代动力学性质而不能进
一步开发。有效的猜测和模拟化合物的吸收、分布、
收稿日期:2002212210
代谢和排泄(ADME) 特性还需要很长时间。在药物
发现的早期考虑物理化学、药代动力学和生物药效
性质即为基于性质的药物设计。
化学上排列组合的空间很大。即使是一个分子
量%26lt; 500 的稳定合理的化合物,假如按照药物化学
所需的构建单元(C ,H ,N ,O ,S ,P ,F ,Cl 和Br) 排列,
其可能性可达1062~1063 。一方面,因为化学空间的
巨大可变性只有计算方法才能完成;另一方面,处理
具有107~1010个结构的化合物库,尤其当同时处理
3D 信息时,其计算量也是一个很大的困难。组合化
学和高通量筛选的发展过程表明,人们没有足够的
能力考虑空间方面的多变性(3D 和构型) ,以及现有
空间描述的不完整性。由于缺少有效而科学的以物
理化学为基础的方法,在处理众多结构时,导致了质
量和数量的对立,即一方面高通量方法不可靠,另一
方面能可靠处理化合物的小组设计的方法耗时间。
1. 3 计算机模型
虚拟实验室的发展目标是模拟及替换部分真实
情况下的实验检测,包括培养细胞、动物甚至人。将
来可能发展所谓“虚拟病人”,即模拟人类疾病所有
的重要方面。计算机模型可能从药物吸收途径,药
代动力学和药效学模型给予临床试验结果。已经实
现的计算机辅助追踪药物代谢( retrometabolic) 设计
的专家系统,不仅可以产生新的软药和相关的化学
释放系统结构,而且可以辅助筛选最有希望的候选
化合物。计算能力以指数速度稳定增长是广泛应用
CADD 技术的主要原因。
2 定量参数
许多计算参数可应用于定量分析之中。良好的
国外医学药学分册 2003 年6 月 第30 卷第3 期·135 ·
计算参数应由结构衍生,与结构相关,并具有物理化
学意义且易被药物化学家和合成化学家所阐明。
2. 1 定量参数种类
分子量( Mr) 、分子体积( V) 及表面积( S ) 等定
量参数相对轻易计算,但是正确快速的V 和S 计算
所需要的分析方法很复杂。拓扑学性质(连接性) 参
数因轻易计算也较常采用,它们与分子的大小和结
构相关,但很难解释其物理化学意义。指示变量因
易于引进、计算和解释而广泛使用。实际上,可以仅
用指示变量作为结构定量参数。假如在回归分析研
究中使用,结果为附加模型或Free2Wilson 分析。因
为使用指示变量提前假定组别贡献,即假定一个组
或者一部分在正确数值范围,所以不完全正确。
电性参数是很重要的类别。其早期参数, 如
Hammett 常数σ及其不同变异(σm ,σp ,σ3 ) 或域和共
振组成部分(F) , (R) ,已被量子化学参数广泛取代。
其中偶极力矩( D) ,极化力(α) ,部分原子电荷(qi) 或
HOMO2LUMO 能量,在大量定量分析中被证实相当
有用。合并电子和结构或大小相关参数也能提供有
用的定量参数,如电荷部分表面积、极表面积(PSA)
或静电势2调整表面积也被应用。p Ka 值或NMR 化
学位移(δ) 在猜测模型和评价时也被以电子参数使
用,它们不是结构衍生参数,可由实验判定或相关评
估获得。
立体参数描述空间可接近性。Taft 立体常数
( Es) 是以实验数据为基础衍生,其他参数为结构衍
生。它们包括:Charton ν立体参数、STERIMOL 参数
(L , B1~ B4 和B5) 或简单的分支指示符。最近,固
体角(inaccessible solid angle)Ωh 也可用来描述立体
位阻大小。其他量度,如选定原子或官能团的溶剂
影响S ,也同样可描述立体信息。
因为氢键是在水环境中起作用,氢键参数很重
要。仅在整数和连续数值范围(如片段贡献或MO
计算) 中使用。分子动态模拟也可用于评定氢键数
目,从而提供可由片段贡献相关的模型,包括考虑氢
键位置的电子和立体环境的QikProp 模型。
疏水参数,如log P 或log k′层析容量因子,应用
较为广泛和成功,它们可以是实验值,亦可以是计算
值或猜测值。辛醇2水分配系数的对数(log Po/w) 是
最常用参数之一,可通过结构经计算获得,它是许多
QSPR 猜测方法中所使用的主要参数。一些缩略词
如AlogP ,BLOGP , CLOGP , ElogP , KLOGP , MLOGP ,
QlogP ,VLOGP 和XLOGP 等可以很好地描述现有的
大量方法。通过类比Hammettσx 常数引入的疏水性
参数π,也可用于结构衍生参数,但其基团贡献的真
实值不明确,即其数值依靠于所用的测定方法。
上述这些定量参数较全面地涵盖了一个多维空
间,但因它们具有交叉性,其对应的化学数据点仅分
布于较有限的亚空间。大小和氢键相关的参数看来
常与性质相关联。早期主成分分析(PCA) 仅应用于
已知液体,含2 个因子且其中1 个已明确与大小相
关,能解释大部分性质的差异。疏水参数,尤其是
log Po/w的成功应用可能是其代表了大小与氢键参数
的综合特性。
2. 2 “类药”
在药物和非药物结构之间没有明确界限。70 %
的现有药物具有0~2 个氢键供体、2~9 个氢键受
体、2~8 个可旋转键和1~4 个环。确定结构骨架
对药物设计尤其有效,这些构建单元称为优先结构。
分析现有药物基本结构骨架揭示结构变化性很低,
其中一半药物仅占据了32 个基本骨架,而可能骨架
为1 179 个。
分析市场上药物性质而得的启发式“Lipinski 5
规则”,已成为解决通透性和溶解度问题的标准原
则,使口服候选药物发展机会最大化。“5 规则”要
求分子量%26lt; 500 ,氢键供体%26lt; 5 个,氢键受体%26lt; 10 个
的结构,且计算的CLOGP %26lt; 5。药物化学家倾向于调
整其先导化合物以发展具有较低Mr 、较低脂溶性
(CLOGP) 和较少氢键受体的结构。在此基础上假如
从限制更多的化合物库中(如100 %26lt; Mr %26lt; 300 ,1 %26lt;
CLOGP %26lt; 3) 寻找口服药物则更轻易成功。
这些经验规则在任何药物的探索中都是有用
的,但是不能应用于决策时的硬性筛选,而仅作为科
学筛选过程中的软性基础。许多现有效益很好的药
物可能不符合这种类药的规定,而且经常发生参数
的变更,新结构可能不适合现有规则。
3 模建方法
计算机定量方法是综合化学结构、生物或物理
化学性质及活性进行QSAR 或QSPR 研究。药物设
计的最终目标是描述化学结构的部分生理学活性,
A = F( c) 。因为药物分布与结合过程是受相应自由
能差支配的平衡过程, K = e - △G/ RT = e - ( △H- T△S) / RT ,
这种关系应使用对数衡量化学生物学数据,例如通
过摩尔浓度倒数1/ c ,底物或受体结合常数、速率常
数、抑制常数或药代动力学参数进行体外或体
·136 · Foreign Medical Sciences Section on Pharmacy 2003 Jun ; 30(3)
内活性检验。为检测生物试验误差,需要用回归
分析。
3. 1 Hansch 模型
Hansch 模型表达相互性质关系,其普通方程类
型为:
log 1/ c = a0 + Σ
i
ai pi
式中pi 为性质参数,ai 为系数,通常由线性回归决
定。一个典型的例子为:
log 1/ c = a0 + a1log P + a2 (log P) 2 + a3 Es + a4σ+ %26#8943;
这种模型以假设具有足够描述参数和性质为基
础,可猜测其他活性值,许多分子(整个分子) 可用此
模型描述。
从几何学解释,代表化合物在多维参数空间的
数据点应分散于较少的参数表面,可形象化为2D(1
性质,1 参数) 和3D(1 性质,2 参数) 。这种形象化在
解释PCA 也有用,PCA 是一种在分析大量数据时常
用的方法,主成分代表新的(正交) 轴穿过n 维空间
的化合物点,相对应于可得的n 种性质。描述主成
分最好的线穿过所用的点和相应的最长维,线性合
并原始n 种性质并解释数据中方差的最大可能部
分。第二主成分正交至第一主成分且在正交方向对
应于下一最长维,也可使用PCA。
3. 2 Free2Wilson 模型
另一主要定量模型为Free2Wilson 模型(也称为
附加模型,全新药物设计) 。其早期形式由Bruice 等
提出,由Fujita 和Ban 改进,目前几乎专用于相关生
物活性和新特异性取代基团贡献(ai) :
log 1/ c = a0 + Σ
i
ai ni
式中ni 为随i 部分变化的参数。此模型是大部分
碎片或基团贡献猜测方法的基础。
3. 3 神经网络和其他模型
前两种模型本质上是回归分析方法,神经网络
(neural network , NN) 模型代表另一种方法。它们是
新的计算技术,依靠于相互连接单元层,试图模拟大
脑功能,最近被引入QSAR 和药物设计研究。NN 可
以提供完美非线性模型,但是很难发展内置参数。
在某些情况下,多重回归模型优于NN。
在过去10 年中探讨的许多其他分析方法,包括
从偏最小二乘法至一般算法或从分子指纹图谱至比
较分子力场分析(CoMFA) ,但是由于这些方法需要
大量数学计算和相关程序,因此阻碍了其进一步的
应用。
4 定量关系
4. 1 定量结构2性质关系
从猜测方面,因为在平常检测中仅涉及物理化
学性质,所以未包括生物性质。一些基本的物理化
学性质如沸点、熔点、蒸气压、酸碱性(p Ki) 、脂溶性
(通常由log Po/w测定) 、水溶性、临界胶原浓度和环
糊精表面能可能对药物设计有作用。其中脂溶性和
水溶性非凡重要,而因为在结晶状态的复杂相互作
用使熔点的重要性存在疑问。在一个更宽的检测范
围内QSPR 覆盖了生物性质如生物膜通透性,包括
Caco22、血脑屏障、肠道、角膜或皮肤通透性及更复
杂的性质如肠道药物吸收和生物利用度。实际上在
更宽检测范围时,任何活性、亲和力或毒性均表现为
一种性质。
4. 2 定量构效关系
Science 的科学信息网站研究所的一项搜索得
到15 157 篇构效关系参考文献,其中2 783 篇涉及
结构2性质,89 篇涉及结构2代谢;若加上定量限定,
仅有2 496 篇涉及QSAR ,294 篇涉及QSPR ,8 篇涉及
QSMR。QSAR 的研究始于1962 年Hansch 等报道的
一篇文章。但是,QSAR ,QSPR ,QSMR 作为术语首先
被提及分别是在1967 ,1985 和1991 年的ISI 数据库。
已建立QSAR 中许多衍生于同类或密切相关结
构,并且数据相对较少,故需谨慎对待,但是任何定
量模型应该对化学结构和化学或生物活性有明显贡
献。在药物发展过程后期,通过消除许多不可开发
化合物可显著节省时间和资金。
4. 3 定量结构2代谢关系
在药物设计早期,综合代谢、药代动力学和普通
物理化学因素很重要。最近大量应用计算机系统预
测生命代谢。对于代谢研究,许多课题涉及细胞色
素P450 (CYP) 及其不同异构体,例如传统的CYP3A4
的LFER 研究,CYP2D6 的CoMFA 研究,CYP2D6 的
结合蛋白和药效团模型等研究。
药效团的3D 构型分子特征或片段,对于研究
生物活性和药理学特异性是必需的,因而在不同领
域中进行了大量计算努力。处理这些3D 结构和可
互换的相应定量参数或有关分子重叠甚至大结构库
是计算机的任务。已使用药效团模型或理论计算识
别转运体如P2糖蛋白的底物。因为有证据表明活
性转运体对于化学物质在生物体内的代谢起着重要
作用,故代谢中的定量结构2转运关系可能与QSMR
同样重要。
国外医学药学分册 2003 年6 月 第30 卷第3 期·137 ·
5 结语
目前,在药物研究和开发领域,计算机辅助设计
取得了巨大进步,QSPR/ QSAR/ QSMR 模型已经成为
药物设计不可缺少的计算工具。但是,计算机猜测
模型目前仍然不可完全依靠或者不能普遍适用。如
果在药物设计和发展过程中很好地结合CADD 方
法,则可以更好地理解、解释和猜测药物研制的各个
环节。
上一篇:抗艾药新星隐现 下一篇:谈谈药物化学结构修饰作用