论文部分内容阅读
一、引言量子化学的终极目标是运用量子力学的基本原理来解决化学的实际问题。根据量子力学原理,一个微观体系的所有信息都包含在波函数中,求解在Born-Oppenheimer近似下的非相对论、不含时Schrodinger方程就成为了求解许多理论化学问题的关键所在1927年物理学家Heitler和London将量子力学处理原子结构的方法应用于H2分子,成功地阐释了两个中性原子形成化学键的过程,他们的成功标志着量子力学与化学的交叉学科——量子化学的诞生。Pauling在H2分子模型基础上发展了价键理论,并且因此获得了1954年度的诺贝尔化学奖:1928年,物理化学家Mulliken提出了最早的分子轨道理论:1931年,Huckel发展了Mulliken的分子轨道理论,并将其应用于对C6H6分子等共轭体系的处理:Bethe于1931年提出了配位场理论并将其应用于过渡金属元素在配位场中能级分裂状况的理论研究,后来,配位场理论与分子轨道理论相结合发展出了现代配位场理论。价键理论、分子轨道理论以及配位场理论是量子化学描述分子结构的三大基础理论。早期,由于计算手段非常有限,计算量相对较小,且较为直观的价键理论在量子化学研究领域占据着主导地位,1950年代之后,随着计算机的出现和飞速发展,以及高斯函数的引进,海量计算已经成为可以轻松完成的任务,分子轨道理论的优势在这样的背景下凸现出来,逐渐取代了价键理论的位置,目前在分子结构和化学键理论中占主导地位。1928年,Hartree提出了分子轨道理论中著名的Hartree方程,方程将每一个电子都看作是在其余的电子所提供的平均势场中运动的,通过迭代法给出每一个电子的运动方程。1930年,Fock对Hartree方程补充了泡利原理,提出HF方程,进一步完善了由Hartree发展的方程。为了求解HF方程,1951年Roothaan进一步提出将方程中的分子轨道用组成分子的原子轨道线性展开,发展出了著名的RHF方程,这个方程以及在这个方程基础上进一步发展的方法是现代量子化学处理问题的主要方法。虽然量子力学以及量子化学的基本理论早在1930年代就已经基本成型,但是所涉及的多体Schrodinger方程形式非常复杂,至今仍然没有精确解法,而即便是近似解,所需要的计算量也是惊人的,例如:一个拥有100个电子的小分子体系,在求解RHF方程的过程中仅仅双电子积分一项就有108个之巨。这样的计算显然是人力所不能完成的,因而在此后的数十年中,量子化学进展缓慢,甚至为从事实验的化学家所排斥。1953年,Parise、 Parr和Pople使用手摇计算器分别独立地实现了对N2分子的RHF自洽场计算,虽然整个计算过程耗时整整两年,但是这一成功向实验化学家证明了量子化学理论确实可以准确地描述分子的结构和性质,并且为量子化学打开了计算机时代的大门,因而这一计算结果有着划时代的意义。1952年日本化学家Fukui提出了前线轨道理论,1965年美国有机化学家Woodward和量子化学家Hoffmann提出了有机反应中的分子轨道对称守恒原理。Fukui、Woodward和Hoffmann的理论使用简单的模型,以简单分子轨道理论为基础,回避那些高深的数学运算而以一种直观的形式将量子化学理论应用于对化学反应的定性处理,通过他们的理论,实验化学家得以直观地窥探分子轨道波函数等抽象概念。Fukui和Hoffmann凭借他们这一贡献获得了1981年度的诺贝尔化学奖。在计算方法方而,随着计算机的发展,量子化学计算方法也飞速发展,在1920年代至今,涌现出了组态相互作用方法、多体微扰理论、密度泛函理论以及数量众多的半经验计算方法,由于量子化学家们的工作,现在已经有大量商用量子化学计算软件出现,其中很多都能够在普通PC机上实现化学精度的量化计算,昔日神秘的量子化学理论,已经成为化学家常用的理论工具。Pople与Kohn分别因为发展首个普及的量子化学软件(Gaussian)和提出密度泛函理论(Density Functional Theory)而获得1998年诺贝尔化学奖。他们的工作使实验和理论能够共同协力探讨分子体系的性质,使整个化学领域正在经历一场革命性的变化,即化学不再是纯实验科学。电子结构理论的经典方法,如前面提到的HF方法和post-HF方法,都是基于复杂的多电子波函数的。密度泛函理论的主要目标就是用电子密度取代波函数做为研究的基本变量。因为多电子波函数有3N个变量(N为电子数),而电子密度仅是三个空间变量的函数,无论在概念上还是实际上都更方便处理。虽然密度泛函理论的概念起源于Thomas-Fermi模型,但直到1964年Hohenberg-Kohn定理提出之后才有了坚实的理论依据。HK第一定理指出体系的基态能量仅仅是电子概率密度分布的泛函。HK第二定理证明了以基态密度为变量,将体系能量最小化之后就得到了基态能量。DFT理论最初只适用于没有磁场存在的基态,现在已经被推广。最初的Hohenberg-Kohn定理仅仅指出了一一对应关系的存在,但是没有提供任何这种精确的对应关系。正是在这些精确的对应关系中存在着近似。密度泛函理论最普遍的应用是通过Kohn-Sham方法实现的。在KS-DFT框架中,复杂的多体问题被简化成一个没有相互作用的电子在有效势场中运动的问题。这个有效势场包括了外部势场以及电子间库仑相互作用的影响,例如交换和关联作用。处理交换关联作用是KS-DFT的难点,目前尚没有精确求解交换相关能E、。的方法。最简单的近似求解方法是局域密度近似(LDA)。LDA近似用均匀电子气来计算体系的交换能,而采用对自由电子气进行拟合的方法来处理关联能。自1970年以来,密度泛函理论在固体物理学计算中得到广泛的应用。多数情况下,与其他解决量子力学多体问题的方法相比,采用局域密度近似的密度泛函理论给出了非常令人满意的结果,同时固态计算相比实验的费用要少。尽管如此,人们普遍认为量子化学计算不能给出足够精确的结果,直到二十世纪九十年代,理论中所采用的近似被重新提炼成更好的交换相关作用模型。密度泛函理论是目前多种领域中电子结构计算的领先方法。密度泛函理论尽管得到改进,但是描述分子间作用力,特别是范德华力,或者计算半导体的能隙还存在一定的困难。在密度泛函理论取得巨大成功的同时,人们开始思考怎样从计算数据中提取意义深刻的物理化学概念。在美国北卡罗莱纳大学的R. G. Parr教授进行了一系列开创性的工作后,一个崭新的研究领域,密度泛函活性理论(也叫概念密度泛函理论)便诞生了。密度泛函活性理论的出发点是体系基态的性质可以由电子总数和外部势场准确地描述,当体系受到外界的扰动时,电子总数和外部势场也会随之而发生改变,从而导致体系能量的改变。运用Taylor级数展开,可以得到一系列总能量对电子总数或者外部势场的一阶、二阶及高阶偏导数。密度泛函活性理论的主要目标之一就是使得这些偏微商具有明确的化学意义。典型的有电负性、化学势、硬度、软度和亲电性等。这些活性指数不仅概念清晰,而且在实际计算中相当方便,都可以通过分子前线轨道密度或者能量,如最高占据轨道和最低空轨道来进行近似计算。在文献中,已经提出了“最大硬度原理”和“最小亲电子性原理”等原理分别用来描述分子的稳定性和反应活性。本文正是在这样的一个历史背景下提出使用密度泛函理论、密度泛函活性理论、能量分解分析、自然键轨道分析和非键弱项互作用等理论和方法来研究:(1)分子酸性;(2)顺式效应;(3)锌指蛋白金属键合的特异性。使用酸性原子核处的分子静电势(MEP)和价自然原子轨道(NAO)能量之和这两个量子力学描述符,我们发现这两者之间存在着很好的线性关系,同时与实验pKa值之间也存在着很好的线性关系。使用建立起来的模型,我们对一些生物活性分子以及二肽的分子酸性进行了预测。此外,使用双取代乙烯作为例子,我们研究了顺式效应的来源和本质。首先使用不同的理论方法对顺式效应的存在进行了计算证明。同时使用不同的密度泛函和基组进行了测试。结果表明,顺式效应的重现较少地依赖于所选择地近似密度泛函,更多地依赖于所选择的基组。使用自然键轨道分析和非键弱相互作用分析顺式构象,我们发现,取代原子或者基团之间存在着微弱的非键吸引作用。但是这并不能解释所有研究分子的顺式效应。使用能量分解分析及双变量拟合分析,我们发现,静电相互作用才是顺式效应一般性的来源,尽管动能和空间位阻也有一定的贡献。最后,我们使用密度泛函活性理论指数分别研究了从锌指蛋白中提炼简化出来的三种结构模型,探讨为什么这些体系对锌离子有很高的键合专一性。结果表明,我们所研究的三种锌指蛋白分子模型结构都同时具有最大的稳定性和最强的反应活性,这种稳定性和反应活性完美结合表现出来的独特性质很好地诠释了锌指蛋白对锌离子键合的特异性。本论文所包括的对如上三个不同体系的研究结果都已经分别整理成文,并且已经在不同的专业杂志上全文发表。二、生物分子酸性的密度泛函活性理论研究氨基酸和核酸碱基是生物体系的构建模块。清晰地掌握它们的物理化学性质对理解生理机能和大分子体系如蛋白质和DNA/RNA的性质和活性至关重要。其中分子酸性(pKa值)就是其中非常重要的性质之一。实验上,分子酸性可以由电位测定法、导电分析法、反相高效液相色谱法、滴定分析法以及核磁共振等方法测定。然而,用这样的实验方法去测定pKa值并不是件简单直接的工作,因此常常导致结果有很大的不确定因素。理论上,使用从头算和密度泛函理论方法计算模拟分子酸性的工作大致可以分为三类:(ⅰ)使用各种量子力学描述符和统计学方法建立一些预测性的模型;(ⅱ)基于热力学循环的从头算方法;(ⅲ)基于分子片的方法。文献中,还存在着其他的一些方法,例如基于最小二乘法的定量构效关系、半经验参数和量子拓扑分子相似性等等。例如,Jorgensen等人提出结合从头算方法和自由能微扰方法考虑溶剂化效应。尽管从头算量子力学方法得到了广泛的应用,但是这些方法计算耗时,而且常常容易出错。精度上的稍微提高总是需要付出更多的计算代价。使用量子力学描述符预测pKa值已经有很长的历史了。全局描述符,如前线分子轨道能量就只取得了很有限的成功。最近,文献报道,发现分子酸性是酸性原子附近的一个局域性质,环境的影响(例如取代基、溶剂效应等)通过电子密度的改变反应在那块较小的区域,同时提出使用酸性原子和离去质子原子核上的静电势以及自然原子轨道能量这两个量子力学描述符定量地描述实验pKa值。在此之前,文献已经发现在一些无极和有机体系中,这两个量子描述符之间以及和实验pKa值之间存在着很好的线性关系。然而这方法迄今为止还没有运用于分子生物体系。这就是本工作试图解决的问题。理论上,弱酸HA部分电离成质子(H+)和它的共轭碱(A-),pKa可以通过Henderson-Hasselbalch方程定义为:其中在给定pH值时,[A-]和[HA]分别是质子化和去质子化物种的平衡浓度。在热力学中,上述解离方程式的平衡常数与标准吉布斯自由能变紧密地联系在一起其中R是气体常数,T是开尔文温度。从更实际的角度而言,使用从头算和密度泛函理论方法可以通过热力学循环算出pKa值。根据这个循环,如下自由能变化必须一一通过计算模拟出来:其中ΔGaqp是气态物种去质子化自由能变△Ggasp,质子化物种的去溶剂化自由能-△Gaolp,质子化物种的溶剂化能△Gaoldp,以及质子溶剂化自由能ΔGsolH+的总和。然而这种方法不仅计算量很大而且由于计算中使用了溶剂模型导致容易出错。本研究选取了47种具有生物活性的分子,其中包括20种α-氨基酸、5种天然核酸碱基和22种衍生物(见正文第22页),以及其他的一些具有生物活性的分子体系。首先,所有的结构在密度泛函B3LYP/6-311G(d,p)理论水平下进行优化,以获得气态条件下的能量最低点。在同样的理论水平下进行单点频率计算,以确保优化所得到的结构确实是势能面上的最低点(例如没有虚频)。之后,通过在计算单点能时,进行自然键轨道分析获得每个原子核的静电势和价自然轨道能量。同时使用了CPCM溶剂化模型模拟溶剂效应。所有的量子化学计算由]Gaussian09软件完成,不使用任何对称限制以获得全部的变分自由度,使用了严格的自洽场收敛标准和超精细积分格点以获得更高的精度。表1(见正文第24页)列出的是20种α--氨基酸以及三个残基His、Lys和Arg酸性氮原子核处的分子静电势MEPN、司一氮原子2p自然价轨道能量之和NAON以及实验pKa值,变化范围从6.0(His残基)到12.48(Arg残基)。MEPN和NAON存在着非常好的线性关系,相关系数为R2=0.99(结果没有给出)。将MEPN或者NAON与表中最后一列的实验pKa值进行关联,可以得到相关系数为0.88。这结果与之前研究的无机和有机小分子体系的结果非常吻合,这就意味着MEP和NAO是两个等价的定量描述符,使用这两个物理量,人们可以将之与生物相关的分子体系的pKa值联系起来。接下来,我们将同样的思想运用到DNA和RNA的构建模块及一些和它们相关的体系。表2(见正文第25页)展示的是20种DNA/RNA体系中氮原子核的分子静电势(MEPN)和同一氮原子2p价轨道自然原子轨道能量之和以及相应的来自文献中的实验pKa值。5种天然碱基的MEPN值从鸟甘酸的-18.322a.u.到组胺的-18.432a.u.,这就意味着酸性原子的MEP值对周围的环境比较敏感。将MEPN对NAON作图(结果没有列出来),我们再一次观察到一条非常好的线性关系,相关系数R2=0.98。如果将实验pKa数据和对MEPN或者NAON作图,相关系数为R2=0.94。这结果与表1中蛋白质基本组成单元的结果非常吻合,这意味着之前的结论同样适用于DNA和RNA以及它们相关的体系。将表1和表2的结果放到一起,用MEPN对NAON作图,如图1(见正文第26页)所示,得到总的相关系数R2=0.96。使用NAO或者MEP对研究的43种化合物进行作图,如图2(见正文第27页)所示,得到相关系数为R2=0.91。从图1和图2的结果明确地发现,使用酸性原子的MEP和NAO可以与生物分子体系的实验pKa值很好地关联起来。这个结论扩大了这种方法原先的适用范围,因为之前的结果只是很好地证明了这种方法非常有效地适用于无极和有机小分子体系。使用图2中所建立的模型,也就是MEP或者NAO与生物分子体系的实验pKa值之间已经建立起来的很好的线性关系,我们可以用来预测其他相似体系的pKa值。作为一些示范性的列子,我们将这个模型用于三种情况:(ⅰ)预测不同介电常数下的pKa值得趋势;(ⅱ)预测十种非天然碱基的pKa值;(ⅲ)预测几种二:肽的pKa值。表3(见正文第27页)给出的是在不同介电常数的水中pKa值的变化趋势。从表中可以看出当介电常数增加的时候,MEPN也是增加的,并且NAON和pKa值都是下降的。然而,这些变化程度相对较小,这意味着pKa值应该对蛋白质中的介电环境不是非常敏感。表4(见正文第28页)列出的是10种非天然碱基pKa的预计值。和我们找到的可用的实验pKa值相比,预测值和实验值是吻合地非常好。表5(见正文第29页)是对7种二肽His-His、Lys-Lys、Met-Met、Val-Val、 Gly-Gly、Gly-Ala和Ala-Glyp的pKa值的预测。当两个氨基酸残基键合到一起的时候,酸性原子的微环境肯定会受到影响,从而导致MEP、NAO和pKa值的变化。我们期望这种方法可以运用于其他更复杂的大分子体系例如蛋白质和DNA/RNA。由于缺乏可靠的实验数据,到目前为止我们没办法去比较。在将来的工作中,我们将使用另外一种计算方法来解决这个问题。沿着这个方向的更多的工作仍进行中。三、顺式效应的密度泛函活性理论研究众所周知,双取代乙烯的反式构象具有更低的总能量,因此比相应的顺式构象更稳定。这是因为反式构象在立体效应和静电相互作用方面等方面更有利。然而,例外也是存在的。例如,含卤化合物,1,2-二氟乙烯、1,2-二氯乙烯和1,2-氟氯乙烯就是这样的反例。实验证明由于存在电负性较大的卤原子,顺式构象不同寻常的稳定性范围在1.09到4.52kJ·mol-1之间。顺式构象的这种不同寻常的稳定性就叫做顺式效应。双键并不是顺式效应所必需的,例如在1,2二氟乙烷和1,2二甲氧基乙烷“偏转”和反式旋转异构体烷存在类似的“偏转”效应。尽管Craig早已从实验上证明了顺式效应的存在,人们开展了更多的研究来证实这种效应的存在。然而,文献中就这种效应的来源和本质并没有一个一致的结论。使用分子轨道理论,Epiotis建立了一种分类非键相互作用的方法,提出l,2-二氟乙烯中氟原子孤对电子之间的相互作用是吸引的,从而使得顺式具有更多有利的相互作用。之后,Kollman进行了一些从头算计算,在此基础之上他提出1,2-二氟乙烯中的吸引作用不是来自孤对电子的相互作用。相反,由于氟元素更强的亲电本质,使得C-F单键发生了改变,而吸引作用就来源于此。Bernardi等人解释了轨道或者孤对电子中的相互作用的总的结果是去稳定的。顺式构象比反式构象具有较少的去稳定作用才使得这种效应存在。同时,Cremer使用二阶微扰理论方法结合标准的Pople极化基组6-31G(d)、6-31G(d,p)和6-311G(d)以及实验测定的分子结构得到了令人满意的1,2-二氟乙烯反式和顺式构象能量差为3.77kJ·mol-1,这意味着电子相关效应可以用来解释这两种构象之间较小的能量差值。Gandhi与合作者使用增加了弥散函数的从DZ到TZ+P的相关基组进行了一系列计算,结果表明只要采用足够大的基组和精确的实验结构,顺式效应甚至可以在Hartree-Fock理论水平上重现。值得注意的是,电子相关效应的信息内在地包含在实验结构中。此外,Saeb(?)等人在四阶微扰理论水平下结合增加两套极化函数的基组优化了1,2-二氟乙烯的顺式和反式构象。他们的结果表明,正确地描述反式和顺式构象之间的能量差值需要有足够精确的结构和较大的原子基组,反式和顺式构象中相关能之间的差异对使用的结构非常敏感,但是如果使用自由结构的话,这种差别可以忽略。Dixon等人指出,Cremer和Gandhi工作的主要问题在于对实验结构的强烈依赖。事实上文献中有三套实验数据,到底使用哪一种并没有统一的认识。Dixon发现如果使用来自相同方法优化的结构,电子相关效应对1,2-二氟乙烯反式和顺式构象能量的贡献可以忽略。有关顺式效应的较近的工作来自于Yamamoto等人,他们使用了高水平的从头算和密度泛函理论方法发现孤对电子离予效应减少了分子内的相互作用。在这部分工作中,我们重访这个没有解决的问题,并且使用文献中一些最近才出现的方法来解决这个问题。我们的目标是双重的。首先,我们使用一系列的密度泛函和基组清楚地证实顺式效应的存在。然后,使用一些分析工具例如自然键轨道分析、能量组分分析、密度泛函活性理论指数和非键相互作用分析探究顺式效应的来源和本质。我们发现,在顺式构象中取代原子或者基团之间存在着弱的相互吸引作用。我们同时发现,静电势、立体能和动能都对顺式效应的存在具有重要的贡献,但是它们都不能单独地解释这种效应的一般性,这意味着顺式效应是一种复杂的源自于多种相互作用的效应。自然键轨道分析、能量组分分析和密度泛函活性理论以及非键弱相互作用对顺式效应得有效性和来源提供了一致的结论。然而,我们使用了二元变量很好地解释了顺式效应的一般性,结果发现静电效应是主要的贡献,立体效应或者动能都有重要的贡献。本文选取了12种双取代乙烯化合物,例如l,2-二氟乙烯、1,2-二氯乙烯、1,2-二甲氧基乙烯、1,2-氟氯乙烯和1,2-氯甲基乙烯。实验数据明确地表明,这些分子体系的顺式构象比反式构象要稳定。示意图1(见正文第38页)中最后三个体系是正常的物种,即反式构象比相应的顺式构象稳定。它们出现在这里只是作为比较。使用不同的密度泛函和基组优化顺式和反式构象以证实顺式效应的有效性。所有的理论基础计算细节请参看正文第35-39页。表1(见正文第40页)列出的是本文所研究的12种分子反式和顺式构象的计算和实验能量差值。在密度泛函B3LYP/6-311+G(d,p)理论水平下优化结构,结合Aug-CC-pVDZ基组,分别测试了六种不同的理论水平,即B3LYP.M06-2X、 MP2、MP、QCISD(T)和CCSD(T)。对于九种具有顺式效应的分子,我们从表1中可以发现(ⅰ)实验数据和计算结果都证实了顺式效应的存在,也就是顺式构象比相应的反式构象要稳定;(ⅱ)从定性的角度而言,所有的理论水平都能重现实验结果;(iii)一般情况下,MP2和CCSD(T)结果比密度泛函理理论结果更接近实验值,但是化合物3和5却是例外,这其中的原因并不清楚;(iv)和实验数据相比,QCISD(T)比CCSD(T)在精度上与实验值更接近,这背后的原因也不清楚;以及(v)泛函B3LYP和M06-2X给出了类似的结果。基于此原因,在后面的分析中,我们同时使用了B3LYP和M06-2X。对于没有顺式效应存在的分子体系,我们发现所有的密度泛函理论和从头算方法都能预测反式构象比顺式构象要稳定。作为例子,表2(见正文第41页)列出的是1,2-二氟乙烯顺式和反式构象在B3LYP/6-311+G(d,p)理论水平下的结构,和B3LYP/Aug-CC-pVDZ理论水平下的电子和光谱性质。我们发现顺式构象中的C-F和C-H单键比相应的反式构象要短,但是C=C双键却变长了。顺式构象中变长的C=C双键允许ZF-C=C增加2.6度却没有影响ZF-C-H。表中这两种物种的热化学数据表明顺式构象的能量比反式低3.30kJ·mol-1, Gibbs自由能低5.19kJ·mol-1。顺式构象的这种额外的稳定性证实了该分子顺式效应的存在性。另外一方面,这结果意味着熵对顺式构象的稳定性也具有积极的贡献。从IR/Raman光潜结果我们发现,尽管顺式构象中C-F反对称伸缩振动比反式构象中的强度要弱,顺式构象中ZF-C-H的而内和而外弯曲模式具有较大的强度。这些较强的弯曲模式来自顺式构象额外的稳定性。我们同时也观察到了顺式构象中的对称伸缩振动具有蓝移锋。TD-DFT计算结果表明和反式构象相比,顺式构象的第一激发峰发生了红移,这表明尽管顺式构象更稳定,但是却具有相对较小的HOMO/LUMO能隙。表2的HOMO/LUMO结果也证实了这一点,我们发现顺式构象比反式构象的HOMO/LUMO能隙少0.015eV。看看HOMO和LUMO能量,我们发现,它们在顺式构象中都降低了,只是HOMO降低的相对比LUMO要少,使得HOMO/LUMO能隙比反式构象要小。看看所有原子的NBO电荷我们发现相对于反式构象,顺式构象中C带有较少的正电荷同时F较少的负电荷,这意味着顺式构象中的C-F具有更多的共价特征。同时,H原子带更多的正电荷,意味着顺式构象中较强的C-H键具有更多的离子特征,这一点可以丛表中较短的C-H键和加强的C-H对称仲缩振动强度得到证实。接下来,我们考察了交换相关泛函和基组对顺式效应有效性的影响。我们使用了1,2-二氟乙烯作为例子。表3(见正文第42页)列出了一系列局域和非局域交换泛函S、XA、B、PW91、mPW、G96、PBE、O、TPSS、BRx、PKZB、wPBEh和PBEh结合不同种类的相关泛函VWN、VWN5、LYP、PL、P86、PW91、B95、 PBE、TPSS、KCIS、PKZB、BRC、VP86和V5LYP对反式-顺式能量之差的影响。对这些测试,我们使用了标准的Pople基组6-311+G(d,p)。从表中我们发现,尽管在数值上存在着差异,在所有的情况下,能量差值都是正值,这意味着顺式效应总是存在的,它的有效性不依赖于我们所选择的近似相关泛函。使用同样的基组,从头算CCSD(T)方法给出的反式-顺式构象能量差值为3.39kJ·mol-1。表4(见正文第44页)给出的是在相同基组的前提下,一系列近似泛函对反式-顺式能量差值的影响。在几乎所有的测试中,有效核势基组LANL2DZ不能够重现顺式效应,然而高水平的Aug-CC-pVDZ和Aug-CC-pVQZ基组能够正确地、定量地预测。LANL2DZ基组的失败提醒我们来自内层电子影响的重要性。使用标准的Pople基组,我们得到的是混合的结果。增加极化和弥散函数,结果似乎看起来更可靠。将表3和表4的结果放在一起,我们证明了顺式效应的有效性较少地依赖于所选择的的近似泛函,而是更多地依赖基组的选择。我们建议研究这种效应的时候,应当使用高水平的基组。我们将使用B3LYP泛函和Aug-CC-pVDZ基组进行后续的研究。现在我们将弄明白顺式构象额外的稳定性是从哪里来的。为了实现这个目的,我们使用了下面的两种分析工具。第一种工具是传统的自然键轨道分析,另外一个是相对较新的一种方法,该方法是通过非键项互作用分析鉴别分子内的非键相互作用。自然键轨道分析的实现是通过在自然键轨道基础上对Fock矩阵进行二阶微扰理论分析,以获得从供体分子轨道j到受体分子轨道j的离域稳定能E2=△Eij=qi×F(i,j)2/(εj-εi),其中q,供体轨道占据数,εj和εi,是轨道能,以及F(i,j)是Fock矩阵的非对角元素。这是一个定量地描述非键相互作用的物理量,因此可以用来描述占据轨道和空轨道之间的额外稳定,这在有机化学里而也叫超共轭效应。表5(见正文第45页)展现的是使用B3LYP和M06-2X泛函对12种分子反式和顺式构象中两取代原子或者基团计算所得到的总的二阶微扰能数值。使用NOBOND关键词,我们只考虑了单中心的原子杂化。从表中我们可以得出如下结论:(i)顺式和反式构象中的取代原子或者基团之间都存在着超共轭效应;(ii)顺式构象中的这种相互作用比反式构象中要强;(iii)这两种构象的这些能量的差值有时候比总能量差值要小。这些自然键轨道分析的结果表明在顺式构象中,两取代原子或者基团之间存在着比较强的非键弱相互作用,在一些体系中,这些额外的稳定性可以用来解释顺式效应的有效性。然而,在其他的体系中,这种额外的稳定性不足以解释顺式效应的有效性。更重要的是,表5中最后的不具有顺式效应的三个体系它们的顺式构象也具有比反式构象更大的的二阶微扰稳定化能,这表明只使用超共轭效应相互作用并不能解释顺式效应的一般性。顺式构象中取代基团之间存在着非键相互作用的事实可以进一步从非键相互作用分析得到证实。图1(见正文第46页)展示的是本文所研究体系中的六个分子顺反式构象的约化密度梯度图,其中前4个(图1a-1d)是有顺式效应的而作为比较剩下的2个(图1e-1f)是没有顺式效应的。图la展示的是约化密度梯度对sign(λ2)ρ(r)的作图,其中C2H2F2顺反式构象密度都来源于密度泛函B3LYP/6-311+G(d,p)理论水平。从图中可以看出,顺式构象在密度为零区域附近存在一个明显的“长钉”,这明确地证实了在顺式构象中存在着弱的非键相互作用。然而,这样的一个“长钉”还没有在C2H2F2反式构象中出现过。在图lb-1d中同样也在顺式构象中发现密度长钉,这意味着在顺式构象中的取代原子或者基团之间存在着更强的非键弱相互作用,这也有可能导致顺式构象具有额外的稳定性。对于它们相应的反式构象尽管存在长钉,它们也小很多。然而,分别在图1e和1f中,对于没有顺式效应的C2H2Me2和C2H2Et2,我们也观测到了同样类型的长钉。这些结果表明尽管我们在顺式构象中发现取代的原子或者基团之间存在较强的弱相互作用,但是它们并不能用来解释顺式效应的普适性,这与我们前面所观测到的自然键轨道分析的结果相吻合。另外一种方法呈现约化密度梯度结果的方法就是使用等值面。图2(见正文第47页)展示的就是在同一理论水平下,0.75原子单位的等值而。在每一个例子中,我们可以清晰地看到在两个取代原子或者基团之间存在着一块较小的圆盘区域,圆盘的红色区域代表排斥相互作用而蓝色区域表示的是吸引相互作用。这些等值面再一次证实了在这两种结构中存在着弱的相互作用而顺式构象具有更强的相互作用。然而这些非键相互作用可以是吸引的也可以是排斥的,这也证实了为什么这些相互作用不能用来解释顺式效应的普适性。最后,我们将转向能量组分分析。表6(见正文第49页)中,我们分别使用式子(1)和(3)进行能量分解分析。根据这些式子,反式和顺式构象的总能量差值可以分解为三项独立的组分为和在第一个能量分解方案中,ΔE来源于三种贡献:动能△Ts、静电相互作用ΔEe和交换相关能ΔExc;在第二个能量分解方案中,这三项是立体效应△Es、静电相互作用△Ee和费米量子效应△Eq。这两种能量分解方案的都具有静电相互作用ΔEe。使用M06-2X近似泛函和Aug-CC-pVDZ基组,表6的第3到7列给出的是这两种分析的结果。从表中我们可以看出在五项能量组分中,△Eq总是负值、△Eq<0、ΔExc总是正值和ΔExc>0,除了第一个分子也都是正值ΔEs>0、ΔTs和AEe可以是负值也可以是正值。为了解释表中前9个分子ΔE为什么是正值ΔE>0,后三个分子体系是负值ΔE<0。如果存在单一的能量组分能够解释顺式效应的普适性,我们就应该在表中要求有这样一个物理量,它的符号要么与△E相同,要么相反。可惜的是,从表中明显可以看出,不存在这样一个物理量。从表中我们可以找到最相近的两个物理量是△Ts和ΔEe,其中,一般而言△Ee和ΔE具有相同的符号而△Ts常常与ΔE具有相反的符号。图3a(见正文第50页)绘制的是ΔEe对ΔE的线性相关性,其相关系数R2=0.71。使用Ts,我们得到R2=0.67(图没有给出)。从表中可以看出,尽管这些相关性尚可,这两个物理量都有例外。例如,对于ΔEe,化合物3、4、8和9是例外;对于△Ts,4、8和9是异常值。就这一点而言,表6说明没有单独的能量组分能够独自解释顺式效应的普适性。也就是说,顺式效应的存在和有效性是一个复杂的现象,这意味着不止一种作用参与其中。在图3b和3c中,我们使用来自等式(6)和(7)的双变量解释。使用两种能量分解方案中的两种能量组分的最小二乘拟合对计算的总能量差值给出更好的拟合,相关系数分别为R2=0.86和0.87。从表6中以及拟合的公式可以看出,ΔEe是一个关键的能量组分。这些结果证实了,即使存在例外,对于顺式效应的有效性ΔEe是最重要的贡献者。这些具有顺式效应的例子中正的ΔEe值意味着顺式构象具有更多的静电相互作用(Ee本身是个负的物理量),然而在正常体系中,反式构象具有更强的静电相互作用。换句话说,如果△Ee的解释是正确的话,在正常和不正常的例子中,静电相互作用能越低,总能量也会越低。在图3b中,对于拟合,△Ts是第二个贡献要素;然而在图3c中,△Es是最小二乘拟合中的又一个能量组分。从图3b中我们没有发现例外,并且只在图3c观察到了一个例外,这意味着使用二元变量的方法可以获得更好的结果解释顺式效应的普适性。我们尝试了其他的二元变量的组合,但是没有获得更好的拟合。从表6中可以发现一些有趣的结果。首先就是总是正值的ΔExc,即使ΔE本身可以为正值也可以为负值。正值的ΔExc表明顺式构象具有更多的交换相关作用(Exc是个负的物理量)。第二就是总是负值的△Eq,费米量子能本身是一个正的物理量。总是负值的△Eq意味着顺式构象比反式构象具有更多的费米量子排斥。最后,密度泛函理论立体能量差值△Es,总是正值除了第一个分子。正值的△Es意味着在顺式构象中具有较少的立体排斥,因为总是非负的。由于Es与密度的一次方成正比,该物理量与分子尺寸(或者体积)成正相关。为了证实这种说法,表6的最后一列给出了所有这些体系反式和顺式构象的摩尔分子体积之差。除了化合物5具有很小的△Vol值,从表中我们发现12个分子中有10个分子的△Vol是正值并且和△Es具有相同的符号。这些结果证实在大部分的情况下顺式构象总是比相应的反式构象具有较小的分子尺寸,这与我们的△Es结果相吻合。为了进行比较,表6也列出了来自自然键轨道分析的基于波函数理论中的使用Pauli不相容原理解释来自相同自旋的排斥的描述立体效应的量△NBOSteric.从表中可以看出,△NBOSteric可以是正值也可以是负值,与△E完全没有任何关联,意味着这个物理量不能解释这种效应的有效性。我们也考虑了来自密度泛函理论或者密度泛函活性理论框架下这些体系其他可能的结构和电子性质的物理量,例如键长的变化、自然键轨道电荷、分子静电势、自然原子轨道能量、化学势、硬度和亲电性等。所考察的这些物理量并没有给出一个一致的答案(结果没有列出)。将所有的结果综合起来,我们的来自于各种计算和分析工具的结果表明(ⅰ)密度泛函理论能够从计算上证实顺式效应的有效性,较少地依赖于近似泛函的选择,更多的是依赖于基组;(ⅱ)自然键轨道和非键相互作用分析清楚地表明顺式构象中的两取代原子或者原子基团之间存在着较强的相互作用,但是这种相互作用可以是吸引的也可以是排斥的,并且在很多例子中不足以解释顺式效应的普适性;(iii)对于不同的能量组分,能量分解方案呈现一幅复杂的画面,也就是没有找到能够单独解释顺式效应有效性的能量组分,其中静电作用△Ee给出最好的拟合为R2=0.71;(iv)△Exc>0、△E>0和ΔEq<0,意味着顺式构象总是具有更多的交换相关作用、较少的立体排斥作用和更多的费米量子排斥以及由摩尔体积证实的较少的立体排斥;和(v)使用△Ee和△Ts或者△Ee和△Es的双变量拟合,获得较好的相关性,相关系数约为R2=0.85。这些结果证实顺式效应是一个具有许多来源的复杂的现象,人们不能简单地用一种作用单独地解释顺式效应有效性的一般性。据我们所知,这是首次仔细地分析和揭露了双取代乙烯复杂的顺式效应的来源和本质。我们期待来自本工作的结果能适用于其他类似的体系。四、锌指蛋白金属键合特异性的密度泛函活性理论研究锌指(zinc finger),一种普遍存在于真核细胞蛋白质中的一种蛋白质-核酸识别蛋白,是一种球状的微型区域,包含一个四面体金属键合来自半胱氨酸和组氨酸残基配体的结合位。实验上已经很好地研究了其结构,例如EXAFS.分光光度法、核磁共振和合成模型。实验结果明确地表明,特定的蛋白质结合核酸的反应活性依赖于锌离子的存在。用蝥合试剂除去锌离子将导致DNA的结合活性完全丧失。添加锌离子而不是其他类似的第一行二价过渡金属离子,例如Mn2+、 Fe2+、Co2+、Ni2+和Cu2+,将恢复反应活性。这现象背后的原因是不清楚的。本文使用概念上富有洞察力并且实际中方便预测分子反应活性和区域选择性的密度泛函活性理论指数来解释锌指蛋白金属键合的特异性。之前的研究工作表明密度泛函活性理论能够解释许多的化学现象和预测分子的酸碱性。在密度泛函活性理论中,化学势μ和硬度η分别定义为在外势v(r)固定的条件下,总能量E对电子总数N的一阶μ=-x=((?)E/(?)N)v和二阶η=((?)2E/(?)N2)v偏导数。化学势μ是电负性(χ)的相反数。软度(S)定义为硬度的倒数,S=1/η。根据Mulliken的说法,人们可以得到μ=χ=-(1/2)(I+A)和η=I-A,其中I和A分别是垂直电离势和电子亲和势。对于闭壳层分子,在Koopman定库和有限差分近似下,I和A分别可以用最高占据轨道能量和最低空轨道能量近似,即I≈-εHOMO;A≈-εLUMO.最近,Parr、Szentpaly和Liu引入了亲电子性ω指数的概念,用化学势μ和硬度η表示为ω=μ2/2η。它表示的是亲电子试剂最多接受来自附近区域电子的能力。更近些,Ayers与合作者提出了两个新的反应活性指数来量化离去基团的亲核与亲电的能力,△En=-A+ω=(μ+η)2/2η和△Ec=I+ω=(μ-η)2/2η.本文研究的锌指蛋白模型缩写为MS4、MS3N1和MS2N2(其中M=Mg,Ca,Sc, Ti,V,Cr,Mn,Fe,Co,Ni,Cu,Zn;S和N分别表示His和Cys残基),其结构均来自RCSB蛋白质数据库,ID分别为1NJ3、2L03和1W04。这三种模型都展现在图1(见正文第61页)中。为了使结构优化的计算变得可预测性,我们使用了“洋葱”模型。分子体系都是处于一个较高的自旋态,使得体系具有更低的能量。优化结束后进行振动频率分析计算以确保优化所得到的结构式势能面上的最低点。洋葱模型的中问层使用了半经验PM6方法,最外层使用了分子力学UFF方法,包含二价金属阳离子和来自His和Cys残基配位原子(S和N)的最高层使用密度泛函理论B3LYP/6-31G(d)方法。所有的量子化学结构优化和性质计算使用了Gaussian09软件,严格的自洽场收敛标准,超精细积分格点以及不考虑对称性。表1-3(见正文第62-64页)总结了三种锌指蛋白模型MS4、MS3N1和MS2N2的密度泛函活性理论指数结果。在表1中,最高占据轨道能量和电负性都是负值,而其他的量例如最低空轨道能量、化学势、硬度和软度都是正值。表1中能够解释大自然为何选择锌而不是其他的金属离子的一个关键的热力学参数便是化学硬度,在所研究的物种中锌具有最大的化学硬度。众所周知,一个具有越大硬度的体系将会更稳定,这意味着锌指蛋白在锌离子键合后具有最大的稳定性。这是锌指蛋白硬币的一面。接下来,我们将看看硬币的另外一面,反应活性。从表1中的电负性χ亲电性ω.electrofugality△Ee和nucleofugality△En可以看出,含锌离子物种的这些指数都具有最大的数值,这意味着具有锌离子的锌指蛋白具有最大的反应活性。总之,来自硬币两而的结果表明含有锌离子的锌指蛋白具有最大的稳定性,同时最高的反应活性。在同一地点同时将常常矛盾的稳定性和反应活性进行这种天衣无缝的结合正是锌指蛋白独一无二的特性。接下来,我们将考察另外一种锌指蛋白模型,MS3N1,其结果都列在表2中。这趋势和结论依然是一样的吗?答案是肯定的。在这种情况下,对锌离子来说,硬度仍然是最大的,同时电负性、亲电性、electrofugality△Ee和nucleofugality△En指数的数值仍然是最大或者第二大的。同样的趋势证实,对于第二类锌指蛋白模型,最大的稳定性和最高的反应活性仍然同时共存于这些体系中。最后,我们将注意力转移到第三类锌指蛋白模型,MS2N2,其结果都列在表3中。从表中可以看出,同样的趋势和同样的结论对这些模型体系依然是有效的,也就是含有锌离子的锌指蛋白仍然具有最大的硬度,然而反应活性指数的数值例如电负性、亲电性、electrofugality和nucleofugality要么是最大的,或者是第二大的。这些结果再一次证实了我们之前得出的这样一个结论,锌指蛋白的独特性就是对一个分子体系两个矛盾的性质,稳定性和活性的惊人的结合。使用密度泛函理论我们研究了分子酸性、顺式效应和锌指蛋白金属键合特异性。分子酸性的研究让我们建立了一个预测其他化合物分子酸性的模型;对顺式效应的研究,我们发现,静电效应起着最主要的作用;对锌指蛋白的研究,我们发现这种特异的金属键合性质可以用稳定性和反应活性很好地解释。这些结果给我们的启发是,密度泛函活性理论能够很好地预测一些常见的化学现象。