GAMESSで分割統治法…のつづき
DC法で計算精度に特に影響を及ぼすのが、緩衝領域(Buffer)の設定です。文献からは、DC-HFで7 Å以上、DC-MP2/CCで5 Å以上の設定が、通常の非分割計算との誤差を1 kcal/mol未満に抑えるのに必要そうです。
前回の記事で「分割の仕方」が大きな影響を与えると書きましたが、それも確かに影響を与えるところではあるのですが、Bufferの設定次第でその影響をかなり小さく出来るのではないか、と思います。Fluoxetineの2つの配座のエネルギー差を求める計算では、確かに分割の仕方を揃えることで大きく誤差が縮小したように見えます。では、分割の仕方を変えずに、Bufferサイズを大きく($DCCORRのRBUFCRを3.0から5.0に変更)すると、計算結果はどうなるかというと…
![]()
※全てSCF計算は分割なし(DCFLG=.F.)
※delta=(conf-1)-(conf-2)
nonDCは、全原子を一つの領域としてBufferなしでDC計算を実施したものです(普通にMP2計算をした時との誤差はほとんどありません)。DCは上から順に、(1)分割パターンをおまかせにしてBuffer半径を3Åに設定、(2)分割パターンをconf-2に揃えてBuffer半径は3 Åのまま、(3)分割パターンはおまかせのままBuffer半径を5 Åに設定、となっています。
分割パターンを揃えると、nonDCとの誤差の不均衡が「悪い方」に揃えられ、結果誤差が相殺されてΔEの符号が正しくなります。一方、Buffer半径を拡大した場合は、誤差の不均衡が「良い方」に揃えられ(conf-1,2ともに<1 mhartree)、ΔEの符号はもとより絶対値レベルでも一致が良くなりました。
分割パターンの任意性が残るせいでそれに起因する誤差が出てしまいますが、Buffer半径を拡大することでそれをかなり抑え込むことが出来そうです。もっといろんなサイズ・形状の分子で計算を行って確かめていく必要があるでしょうが…。
ちなみに、分割パターン指定($DANDCのSUBTYP)で原子(ATOM)を指定すると、分割の任意性は取り除かれます。ですが、大きい分子になると分割が細かすぎて計算時間の短縮効果が失われます(DC法をやる意味がない!)。
Fluoxetineは計算対象としては今や小さい部類ですので、もうちょっと大きな分子で実施してみました。セルロースの部分構造であるβ-D-グルコース8量体です(Facioに同梱のPDBファイルから座標を頂きました)。原子数が171(C48H82O41)ということで、結構な大きさです。タンパク質には遠く及びませんが。
さすがに計算時間がかかるので、MP2ではなく、通常のHFとDC-HFを比べてみると…

※Nはフラグメント数
Buffer半径を8 Åに設定したDC-HF計算は、通常のHF計算との誤差が0.26 mhartree(≒0.16 kcal/mol)に抑えられています。参考にグルコースを1フラグメントとしたFMO2の結果も示しましたが、こちらは結構誤差が大きいです。(分割の仕方やFMO3にするなどで変わってくるとは思いますが)
肝心の計算時間はというと、DC計算の方がこれくらいの分子サイズでは時間がかかります(rbufcr=3ぐらいなら速いのですが、精度がダメ)。もっと大きな系では逆転するでしょう。論文では非常にシンプルな系(1次元ポリエンやポリグリシン)でDC法の基本的な性質を調べていますが、今後多様な分子で計算が行われ、真の使い勝手が明らかになることを期待します。現時点での感触としては、確かに文献通りで、BUFTYP=RADIUSでBUFRAD≧8, RBUFCR≧5であれば、分割パターンにあまり左右されずに誤差<1 mhartreeに抑え込めるように見受けられます(但しDiffuse関数を使わない場合に限り、使う場合はもう1 Å広げる必要があるかも知れません)。