<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
    <title>s2k&apos;s eye 2nd Ed.</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/" />
    <link rel="self" type="application/atom+xml" href="http://blog.3016.net/atom.xml" />
   <id>tag:blog.3016.net,2008://2</id>
    <link rel="service.post" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2" title="s2k's eye 2nd Ed." />
    <updated>2008-06-27T06:41:40Z</updated>
    <subtitle>s2kの雑考記録。でも少し計算化学備忘録風味。</subtitle>
    <generator uri="http://www.sixapart.com/movabletype/">Movable Type  3.2-ja-2</generator>
 
<entry>
    <title>Fedora 9 (x64)でGAMESSを使ってみるテスト。</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/06/fedora_9_x64gamess_1.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=293" title="Fedora 9 (x64)でGAMESSを使ってみるテスト。" />
    <id>tag:blog.3016.net,2008://2.293</id>
    
    <published>2008-06-26T16:40:47Z</published>
    <updated>2008-06-27T06:41:40Z</updated>
    
    <summary>とりあえずの報告。 Fedora 9 (x86-64)を以前使っていたAthlo...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="Chemistry" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        <![CDATA[とりあえずの報告。
<a href="http://fedoraproject.org/ja/">Fedora 9 (x86-64)</a>を以前使っていたAthlon 64 X2機にインストールしました。いやぁインストーラも昔に比べて洗練されて、非常に楽です。Windowsとぱっと見難易度は変わりません。
無事インストールが終わり、GAMESSのソースを展開してコンパイル開始。が、cshがないと。とりあえず現在のメインPC経由でネットにつなぎ、tcshをインストール。ふぅ。コンパイル自体は正常に進行し、あとはリンクするだけというところで今度は線形代数ライブラリがないと。ATLASをインストールし、今度こそ完了。無事並列で計算できました。

<a href="http://blog.3016.net/fedora9x64.jpg"><img alt="fedora9x64.jpg" src="http://blog.3016.net/fedora9x64-thumb.jpg" width="400" height="300" /></a>

3GBのメモリを積んでいますが、$SYSTEMでMWORDS=1100程度まで指定可能に(↑)。x64のcygwinがあれば、Windowsでも同じようにメモリを使えるんだろうが…まぁ、これでメモリを大量消費するNMRの計算なんかもかなり大きな分子まで実行可能になったんではなかろうか。

----

余談ですが、Fedora 9を使っていて、時々タイミング不明でUSBがきかなくなる現象がありました。マウス・キーボード・USBメモリが認識されなくなり、フリーズ状態。今後はとりあえずPS/2のマウスとキーボードでしのぐかなぁ…

【追記@15:30】
上記のUSBの問題は、キーボード/マウスについてはPS/2接続で安定。
「続きを読む」に、WineでWinmostarとFacioを動かした話を追記しました。]]>
        <![CDATA[《並列計算ができるようになるまでの道程》

(1)Fedora 9のインストールメディアの入手
<a href="http://fedoraproject.org/ja/get-fedora">Fedoraのダウンロード案内のページ</a>から、DL終了後に自動で検証もしてくれるBittorrentでx86-64のisoファイルをダウンロード(1.5MB/secぐらい)。
isoファイルをDVDに焼き、インストールメディア完成。

(2)Fedora 9のインストール
インストールするPCのブート順を変えて、DVDドライブを第1優先にする。
ドライブに先のインストールメディアを入れて起動。最初はメディアチェックを要求される(パスもできる)ので、とりあえずチェックしておく。無事問題がなかったのでそのまま…と思ったら、追加でチェックするディスクがあれば入れろと言ってくる。ないのでキャンセルすると、先に進まない！多分これは作成側のミスだと思うが…しょうがないので再起動し、今度はメディアチェックをパスして先に進む。ここから先は順調。
パーティションは/boot, swap, /, /home, /usr, /tmpを別に設定。tmpは大きめにとり、GAMESSのスクラッチディスク領域に使う。本当はスクラッチ分散用に/scr1と/scr2を設定しておくんだったとちと後悔。まぁ、今回はお試しなのでそれは次の機会に。HDD容量も大して無いので。
あとはとんとんと進んで何事もなく終了。Vistaのインストールに比べて格段に短時間。おそらく実動20分弱では。あ、ちなみにインストールするプログラムの選択で「プログラム開発」をチェックしておく(これをチェックしないとgfortranとかインストールされないはず)。

(3)GAMESSのインストール
2008/04/11(R1)のLinux用ソースコード(Linux用といってもほとんどのUNIX系で共通のソースコードみたいだけど)をDLし、/home/s2k以下に展開(ユーザーs2kを作ってそれで作業してます)。あとはmisc以下のreadme.unixに従って作業をするだけ。
comp, compall, lked, ddi/compddiのパス(/home/s2k/gamess)やターゲット(ここではlinux64を選択)を書き換えて保存。compddiについては、cygwinではないのでSYSV=trueのまま。
と、ここでcompallを実行しようとするとcshなんて知らないと怒られてしまうので、GUI上部のシステム＞管理＞ソフトウェアの追加/削除でtcshを追加インストール。これでcshを使えるようになる。compall, compddiはこれで無事実行できる。最後にlkedは、線形代数ライブラリがないと怒られてしまうので、tcshを追加インストールしたときと同様にatlas-3.6.0-15.fc9 (x86_64)を選択してインストール(他にもACMLやMKLが使えるが…)。これでlkedも無事に通り、実行ファイルが生成する。

(4)GAMESSの実行テスト
以前にForumで公開した<a href="http://pc-chem.info/uploader/data2478/rungms_min2.txt">rungms改</a>を利用。DL後、改行コードを

tr -d '\r' < rungms_min2 > rungms

といった要領で変更(CRLFからLFに：上記はCRを削除している)。
あとは自環境向けに書き換えてテストジョブを流す。時間の関係でrunallはしていないが、cygwin/gfortranで問題になったMP2系のジョブも正常に並列計算できた。今のところ、別に64bitになったからといって計算が速くなった実感はないのだが…


《WineでWinmostarとFacioを動かしてみた》

プログラムの追加/削除でWine 1.0.1を導入。以前はLinuxを使う障壁の一つがプログラムのインストールだったと思いますが、今は良くも悪くも簡単になって、敷居は下がってますね。
さて、Wineをインストールしたら、あとはバンバンWin32の実行ファイルを起動できます。Winmostarのインストール(解凍)も、exeファイルをダブルクリックするだけ。あとはホームの.wineフォルダ内にできた仮想Cドライブ直下にwinmos3フォルダができます。
Facioはzipファイルを解凍した後、そのままFacio.exeを実行できます。

<a href="http://blog.3016.net/Winmos_on_Wine.jpg"><img alt="Winmos_on_Wine.jpg" src="http://blog.3016.net/Winmos_on_Wine-thumb.jpg" width="300" height="225" /></a> <a href="http://blog.3016.net/Facio_on_Wine.jpg"><img alt="Facio_on_Wine.jpg" src="http://blog.3016.net/Facio_on_Wine-thumb.jpg" width="300" height="225" /></a>

Winmostarは、新しいバージョン(3.73とか)だとエラーが発生して落ちます(X11絡み?スクリーンショット↓)

<a href="http://blog.3016.net/Winmos_error.jpg"><img alt="Winmos_error.jpg" src="http://blog.3016.net/Winmos_error-thumb.jpg" width="300" height="225" /></a>

でも場合によってはアプリケーション＞Wine＞Wine File(↓)から起動すると普通に動いたり。

<a href="http://blog.3016.net/WineFiles.jpg"><img alt="WineFiles.jpg" src="http://blog.3016.net/WineFiles-thumb.jpg" width="300" height="226" /></a>

謎ですね。。。まぁ、これで分子を自由に組むのには困らないでしょう。
]]>
    </content>
</entry>
<entry>
    <title>JOBを使って$VECと$HESSの読み込み</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/06/jobvechess.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=292" title="JOBを使って$VECと$HESSの読み込み" />
    <id>tag:blog.3016.net,2008://2.292</id>
    
    <published>2008-06-02T12:48:29Z</published>
    <updated>2008-06-02T13:00:53Z</updated>
    
    <summary>備忘録。 PC GAMESSのWebサイトで公開されている、GAMESS入出力加...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="Chemistry" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        備忘録。
PC GAMESSのWebサイトで公開されている、GAMESS入出力加工専用マクロ『JOB』を使って、何気に面倒な$VECと$HESSのPUNCHファイルからの抽出を、.inpファイルと.punファイルのD&amp;Dで実現するバッチファイルを作成しました。イマイチ美しくないコードですが。

-----------------

@echo off

set job_dir=D:\JOB
set f_inp=inp
set f_pun=pun

if &quot;%~x1&quot;==&quot;.inp&quot;  set f_inp=%1
if &quot;%~x1&quot;==&quot;.pun&quot;  set f_pun=%1

if &quot;%~x2&quot;==&quot;.inp&quot;  set f_inp=%2
if &quot;%~x2&quot;==&quot;.pun&quot;  set f_pun=%2

if %f_inp%==inp  goto exterr
if %f_pun%==pun  goto exterr

move %f_inp% %job_dir%\temp.inp

echo #copy_vec %f_pun% %job_dir%\temp.inp &gt; %job_dir%\temp.job
%job_dir%\job.exe %job_dir%\temp.job

move %job_dir%\TEMP.INP %f_inp%

pause
exit

:exterr
echo 拡張子に誤りがあります
pause
exit

-----------------

ドロップされた2つのファイルの拡張子からどちらがinputでどちらがpunchかを判別し、JOB用のファイル(temp.job)を作成して実行。このとき、一回temp.inpに書き込んだ後元の.inpファイルにリネームしてますが、これはJOBがなぜか書き込み先の.inpファイルのファイル名を全て大文字にしてしまう(だからmove行でTEMP.INPと書いている)からです。
#copy_vecを#copy_hessに変えるだけで、$HESSの読み込みに対応します。

本当は、.outも読み込めばNORBを自動で入れてくれたりするので、その辺を実装したバージョンも書いていますが、GAMESS(US)の.outファイルには対応していないようなので(実際NORBは入らない)、それを省いたバージョンを使ってます。

この辺のは、JOBじゃなくてもperlでできたりしますが(最近GAMESS MLにポストされてましたね)、プログラム慣れしてない私にゃJOBが便利です。
        
    </content>
</entry>
<entry>
    <title>HP 2133とRAM Diskのその後</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/05/hp_2133ram_disk.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=291" title="HP 2133とRAM Diskのその後" />
    <id>tag:blog.3016.net,2008://2.291</id>
    
    <published>2008-05-25T08:18:54Z</published>
    <updated>2008-05-25T08:41:42Z</updated>
    
    <summary>HPもついに低価格ミニノート市場に参戦ですね。HP 2133、実に物欲をそそるデ...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="Web" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        <![CDATA[HPもついに低価格ミニノート市場に参戦ですね。HP 2133、実に物欲をそそるデザインっす。

<a href="http://blog.3016.net/hp2133.jpg"><img alt="hp2133.jpg" src="http://blog.3016.net/hp2133-thumb.jpg" width="300" height="300" /></a>

何かMacっぽい？
キーボードは英字onlyですが、僕は英字キーボード使いなので無問題。ていうかむしろ歓迎。液晶の解像度も高く(目が悪くなってきた自分にはちと厳しいか？)、作業領域が広く確保されているところは好印象。
問題はCPUの処理能力と筐体の排熱能力で、あちこちのレビューを見る感じ、Vistaでは若干のもたつきを感じ、またCPU使用率が高いときの筐体の発熱とファンの騒音が結構なものになるようです。やはり、この辺のサイズと価格で、いろいろと犠牲になっている感は否めません(というかしょうがない)。液晶のバックライトもLEDではなく蛍光管のようですし。
個人的には、10万を超えない領域でもうちょっと問題点が解決されたら(特にYoutubeの再生でCPU使用率が100%に到達してしまう処理能力)買いなんですが…同じVIAのプラットフォームならIsaiah待ちということになるのかもしれませんが、Isaiahになってピーク発熱は上がりそうな感じなので、その辺をどうできるか。。。

まぁ、何にせよ、今は買うつもりはありません。むしろEee PC 900の方が…うっかり買ってしまいそうでやばい。

]]>
        ----

前回、OSの管理外領域にRAM Diskを作成する話を書きましたが、その使い道を決めました。
ReadyBoost用に4 GB + Internet Temporary Filesに700 MBです。

RAM Diskはシャットダウンするとクリアされてしまうので、ReadyBoostの設定も起動するたびにやり直さなくてはならないわけですが、Vistaはシャットダウンせずに使うのが本道のようなので、今は休止状態を基本にしてます(低電力でメモリ領域の記憶が保持されるため、再設定が必要ない)。旅行で長期間不在のときはさすがにシャットダウンします(環境のためにも？)。

ReadyBoostによって、HDDの見かけのパフォーマンスは向上してます。システムの入っているHDDのFDBENCHの結果は以下の通り。

***** FDBENCH Ver 1.02 (C)2003-2007 ep82kazu *****
[ReadyBoostなしの場合]
Drive C:\
Drive Size 100MB

  Disk  Read Write  RRead RWrite (KByte/s)
 31629 52919 32323  18645  22629

  Copy    2k   32k  256k    1MB (Operations/min) 
  3415  5244  4326  2172   1920

  Copy    2k   32k  256k    1MB (Kbyte/Sec) 
  7496   117  1545  6239  22083

***** FDBENCH Ver 1.02 (C)2003-2007 ep82kazu *****
[ReadyBoostでRAMDisk4GBを指定した場合]
Drive C:\
Drive Size 100MB

  Disk  Read Write  RRead RWrite (KByte/s)
 36513 52892 46188  20508  26466

  Copy    2k   32k  256k    1MB (Operations/min) 
 11428  8442 24678  9288   3306

  Copy    2k   32k  256k    1MB (Kbyte/Sec) 
 18324   188  8780 26470  37858

Writeのスコアが向上してます。
    </content>
</entry>
<entry>
    <title>RAM Disk作っちまった</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/05/ram_disk.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=290" title="RAM Disk作っちまった" />
    <id>tag:blog.3016.net,2008://2.290</id>
    
    <published>2008-05-12T14:08:43Z</published>
    <updated>2008-05-12T14:25:45Z</updated>
    
    <summary>PC Watchに特別レポートが掲載されていました。 曰く、 「32bit Wi...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="PC" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        <![CDATA[PC Watchに<a href="http://pc.watch.impress.co.jp/docs/2008/0512/ramdisk.htm">特別レポート</a>が掲載されていました。
曰く、

「32bit Windowsの管理外領域メモリでRAMディスクが作れる」

何ッ！そいつぁやるっきゃねぇ！
というわけで、PAEを有効にした後以前相性問題で丸ごとあまったメモリ2本(2GBx2)をメインPCに装着(総計8GB！)し、Gavotte RamdiskでRAMディスクを作成してみたところ、

<a href="http://blog.3016.net/ramdisk.jpg"><img alt="ramdisk.jpg" src="http://blog.3016.net/ramdisk-thumb.jpg" width="300" height="225" /></a>

できとる！
ちなみに、ちゃんと通常の物理メモリも認識しとります。
でも、何に使おう…いや、<strong>GAMESSのスクラッチ領域として使ってみるのが真の漢</strong>だ！というわけで、ベンゼンのRHF/aug-cc-pVDZでの1点計算をconventional SCFで実行してみました。2電子積分をスクラッチファイルに記録するので、File I/Oが激しく発生します。

<table border="1"><tr><td></td><td>CPU</td><td>Wall</td></tr><tr><td>HDD (SATA, 500GB, 7200rpm)</td><td>44.1</td><td>101.9</td></tr><tr><td>HDD (RAID0, SATA, 300GB, 7200rpm)</td><td>38.5</td><td>74.0</td></tr><tr><td>RAM Disk (DDR2-800, 4.74GB)</td><td>41.0</td><td>42.7</td></tr></table>

見ての通り、RAMディスクではCPUとWallの時間差(≒File I/O待ち時間)が2秒足らず！通常のHDDでは1分近くかかるところですんで、まさに既報のベンチマーク結果に違わぬ爆速ぶり！

しかし…容量が5GB弱じゃぁ、ちょっと大きい計算やったらすぐオーバーフローしちゃう…(aug-cc-pVTZはアウトでした)。やっぱ使い道が難しい…IEのテンポラリフォルダぐらいかな。]]>
        
    </content>
</entry>
<entry>
    <title>GAMESS 2008/04/11(R1)の並列化効率(とりあえず版)</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/05/gamess_20080411r1.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=289" title="GAMESS 2008/04/11(R1)の並列化効率(とりあえず版)" />
    <id>tag:blog.3016.net,2008://2.289</id>
    
    <published>2008-05-06T10:05:15Z</published>
    <updated>2008-05-06T12:51:30Z</updated>
    
    <summary>cygwin/g77でコンパイルした最新版GAMESSの並列化効率を、比較的短時...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="Chemistry" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        <![CDATA[cygwin/g77でコンパイルした最新版GAMESSの並列化効率を、比較的短時間の計算(3分程度)を使って計測してみました。File I/O等の寄与はある程度長い計算の方が除けるかもしれませんが、そういうところはとりあえずCPU Timeを指標に。現実的な速度はWall Clock Timeを指標に。

<a href="http://blog.3016.net/pc_eff_wg08.jpg"><img alt="pc_eff_wg08.jpg" src="http://blog.3016.net/pc_eff_wg08-thumb.jpg" width="300" height="333" /></a>
※いずれも閉殻。2回同じ計算を実施した平均値。
※MCSCFは怪しげなエラーのため現在検討中。

CCは相変わらず伸びないっすね。。。ちなみに1 coreで30分程度かかる計算で比較しても、最大で1.4倍＠2 core。HF,DFTは優秀、MP2もまぁまぁ。
GAMESSは2並列で4プロセス発行するんで(しかもメイン以外の2プロセスもCPU使用率を食う…2並列で平均2.5 coreぐらいは使っているのでは)、その影響も結構大きそう？CCSDで2 coreのときにピークなのはその辺もあるかも。core数を増やせばいいってもんでもないのが面白いところ。ノード数が増えれば話は別ですが。]]>
        <![CDATA[MCSCFの怪しげなエラーとは、例えばこんなところ。2 core以上の計算だと、なぜかこんな感じに↓

     --------------------------------------------------
          AMES LABORATORY DETERMINANTAL FULL CI
     PROGRAM WRITTEN BY JOE IVANIC AND KLAUS RUEDENBERG
     --------------------------------------------------

 THE NUMBER OF DETERMINANTS HAVING SPACE SYMMETRY A  
 IN POINT GROUP C1   WITH SZ=  0.0 IS            400
 WHICH INCLUDES            175 CSFS WITH S=  0.0
 WHICH INCLUDES            189 CSFS WITH S=  1.0
 WHICH INCLUDES             35 CSFS WITH S=  2.0
 WHICH INCLUDES              1 CSFS WITH S=  3.0
 THE DETERMINANT FULL CI REQUIRES      148137 WORDS
 INITIAL CI VECTORS READ FROM DISK, NSTATE=   1
 INITIAL FULL CI ITERATION TIME:          0.0

 ITERATION      ENERGY           GRADIENT
     0     -224.2437411993     0.00000000　　　<strong>←？？？</strong>

 CONVERGED STATE    1 ENERGY=     -224.2437411993 IN    0 ITERS

 ALL STATES CONVERGED.

 CI EIGENVECTORS WILL BE LABELED IN GROUP=C1      
 PRINTING CI COEFFICIENTS LARGER THAN  0.050000

 STATE   1  ENERGY=      -224.2437411993  S=  1.30  SZ=  0.00  SPACE SYM=A   

 ALPHA  | BETA   | COEFFICIENT
--------|--------|------------
 ..... DONE WITH DETERMINANT CI COMPUTATION .....
 ON NODE     0 STEP CPU TIME=     0.00 TOTAL CPU TIME=        7.5 (    0.1 MIN)



同じ入力を使っても、1 coreの計算(つまりMEMDDIなし)だとこんな感じ↓で正常終了に至る。

     --------------------------------------------------
          AMES LABORATORY DETERMINANTAL FULL CI
     PROGRAM WRITTEN BY JOE IVANIC AND KLAUS RUEDENBERG
     --------------------------------------------------

 THE NUMBER OF DETERMINANTS HAVING SPACE SYMMETRY A  
 IN POINT GROUP C1   WITH SZ=  0.0 IS            400
 WHICH INCLUDES            175 CSFS WITH S=  0.0
 WHICH INCLUDES            189 CSFS WITH S=  1.0
 WHICH INCLUDES             35 CSFS WITH S=  2.0
 WHICH INCLUDES              1 CSFS WITH S=  3.0
 THE DETERMINANT FULL CI REQUIRES      177837 WORDS
 INITIAL CI VECTORS READ FROM DISK, NSTATE=   1
 INITIAL FULL CI ITERATION TIME:          0.0

 ITERATION      ENERGY           GRADIENT
     0     -230.7249876870     0.10262436
     1     -230.7338189446     0.04201266
     2     -230.7359344336     0.00991418
     3     -230.7360345648     0.00081996
     4     -230.7360351996     0.00016938
     5     -230.7360352446     0.00005406
     6     -230.7360352483     0.00001119
     7     -230.7360352485     0.00000130
     8     -230.7360352485     0.00000024

 CONVERGED STATE    1 ENERGY=     -230.7360352485 IN    8 ITERS

 ALL STATES CONVERGED.

 CI EIGENVECTORS WILL BE LABELED IN GROUP=C1      
 PRINTING CI COEFFICIENTS LARGER THAN  0.050000

 STATE   1  ENERGY=      -230.7360352485  S=  0.00  SZ=  0.00  SPACE SYM=A   

 ALPHA  | BETA   | COEFFICIENT
--------|--------|------------
 111000 | 111000 |   0.9720686
 101100 | 101100 |  -0.1040727
 110010 | 110010 |  -0.1040573
 110100 | 110100 |  -0.0712754
 101010 | 101010 |  -0.0712717
 111000 | 100110 |   0.0711535
 100110 | 111000 |   0.0711535
 110100 | 101010 |   0.0519747
 101010 | 110100 |   0.0519747
 ..... DONE WITH DETERMINANT CI COMPUTATION .....
 STEP CPU TIME =     0.08 TOTAL CPU TIME =       10.7 (    0.2 MIN)

<a href="http://blog.3016.net/mcscftest1.zip">1 core向け入力ファイル(mcscftest1.zip)</a>
2 core 以上の入力ファイルは$SYSTEMがMWORDS=1 MEMDDI=6 PARALL=.T.になっているだけ。
これはバグなんでしょうか？？

【自己解決】
入力ファイルと同名のスクラッチファイル(scratch内)が存在していたことに起因するようで、そこを空にしたら正常終了しました。
んが、FULLNRは並列計算で何でこんなに遅いんだ…4並列で、やっとMEMDDIなしの逐次計算と同じ時間とは…逐次計算でもMEMDDIを使うと激遅になるから、メモリ周りに原因がありそうだ。]]>
    </content>
</entry>
<entry>
    <title>最適化の面白い現象？</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/05/post_52.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=286" title="最適化の面白い現象？" />
    <id>tag:blog.3016.net,2008://2.286</id>
    
    <published>2008-05-03T02:49:18Z</published>
    <updated>2008-05-03T03:31:30Z</updated>
    
    <summary>GAMESSで構造最適化するとき、普通はDLCを使うのが最も高速で、たまに例外が...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="Chemistry" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        <![CDATA[GAMESSで構造最適化するとき、普通はDLCを使うのが最も高速で、たまに例外があるというのがここ最近の私の常識でした。
が、それはどうもPC GAMESSでの話で、本家GAMESSでは勝手が違うこともあるようです。

N-(n-Propyl)acetamideをRHF/STO-3Gで構造最適化する計算をしたときに、直交座標(CART)でやるかDLCでやるかを比較したときに、PC GAMESSとGAMESS(US)で大きな違いがありました。

<table border="1"><tr><td></td><td></td><td>GAMESS(US)<br />08/04/11(R1)</td><td>PC GAMESS<br />7.1.5</td></tr><tr><td rowspan="2">Test 1<br />Cart</td><td>Steps</td><td>39</td><td>76</td></tr><tr><td>Time</td><td>41.6(32.9)</td><td>74.0(75.7)</td></tr><tr><td rowspan="2">Test 2<br />DLC</td><td>Steps</td><td>41</td><td>40</td></tr><tr><td>Time</td><td>43.2(33.8)</td><td>40.5(41.4)</td></tr></table>
※TimeはWall(CPU)

と、PC GAMESSでは常識通りDLCによって大幅に最適化ステップ数と時間が短縮されますが、GAMESS(US)ではCartでもすでにPC GAMESSでDLCを使った場合より早く収束し、しかもDLCを使うとむしろ僅かに悪化するという結果に。
計算の内容自体は分子の構造を含めてもありふれたもので、ちょっと驚きました。
ちなみに、クロロアセトアルデヒドと塩化物イオンのSn2反応のTSを構造最適化する際も、対称性を使ったCartesian座標による計算でしたが、GAMESS(US)の収束が早いという結果でした。

こんなところでも、両プログラムが似て非なるものだなぁ…と感じました。


おまけ
PC GAMESS 7.1.0を7.1.5にアップデートするパッチが大分前から公開されてますが、このアップデートで特に計算が速くなった、という感じは今のところありません(実感できるような内容の計算を実施していないということでしょう)。ただ、両者で大きく違う点が一つだけ見えました。3/4コアを使っての計算の際、各コアの使い方が違うんです。7.1.0は4コアを広く使い、使用率が100%に達しないコアがほとんど。それに対して7.1.5は3コアを重点的に使い、2コアはいつもほぼ使用率が100%という状況。C2Qは2つのダイの張り合わせなのでダイ間の通信が遅くなりますが、その辺を少しでも回避しようという意味合いでしょうか？]]>
        
    </content>
</entry>
<entry>
    <title>GAMESS 2008/04/11(R1)を使ってみた</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/05/gamess_20080411r1_1.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=285" title="GAMESS 2008/04/11(R1)を使ってみた" />
    <id>tag:blog.3016.net,2008://2.285</id>
    
    <published>2008-05-02T04:45:54Z</published>
    <updated>2008-05-02T06:13:46Z</updated>
    
    <summary>まだWindows 向けバイナリのアナウンスはありませんが、自前でコンパイルして...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="Chemistry" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        まだWindows 向けバイナリのアナウンスはありませんが、自前でコンパイルして使ってみました。cygwin上でg77とgfotrran(別途導入)を使って2種類のバイナリを作ってます。TINKERのモジュールも組み込み済み。

さて、パフォーマンスですが、同じg77でコンパイルした2007/03/24(R6)に比べて若干低速化した模様。DFT Gradientの計算では10％近く計算時間が延びるケースも。gfortranでコンパイルするとかなり挽回できます。

《2,2&apos;-Biphenyl, B3LYP1/cc-pVDZ Gradient》
○GAMESS 2008/04/11(R1)
　g77 : 353.9 sec
　gfortran : 338.2 sec
○GAMESS 2007/03/24(R1)
　g77 : 325.3 sec

ただ、なぜか理由が私にはわからないのですが、gfortranでコンパイルしたバイナリはDDIまわりに問題があるらしく、MP2のようにMEMDDIを要求される計算は軒並みアウト。2007/03/24(R6)でも、WinGAMESSとして配布されているバイナリではMP2の並列計算ができないことがあり(これもgfortranでコンパイルされている)、自分でg77でコンパイルし直したら動いたことがありました。

新たに追加された汎関数・M05/06系は、計算時間がB3LYPよりもかかるようで、上記の例では、M05で1.6倍以上の時間が費やされました。

　B3LYP1 : 353.9 sec (gfortran : 338.2 sec)
　M05 : 582.8 sec
　M06 : 574.1 sec
　M06-2X : 491.7 sec (gfortran : 469.7 sec)

ROHFを参照とする結合クラスター理論計算も可能になっていますが、こちらはまだ並列化されていません。しかしながら、ラジカル系のより精度の高い計算が可能になったと言えるでしょう。水分子のO-Hの結合エネルギーをCR-CCSD(T)/aug-cc-pVTZで計算したところ、453.6 kJ/mol (実測 463 kJ/mol)という結果が得られました(誤差 -2%)。ちなみにUMP2/cc-pVDZでは413.7 kJ/mol、CR-CCSD(T)/cc-pVTZでは444.7 kJ/molでした。
並列化されていないことやFile I/Oの時間が長いことなどで、CR-CCSD(T)/aug-cc-pVTZのエネルギー計算は30分かかりました(cpu timeは12分程度)。

※これらの計算は、Core 2 Quad Q9300 (2.5 GHz 定格)で実施しました。
        
    </content>
</entry>
<entry>
    <title>Q9300の使い心地</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/04/q9300_1.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=284" title="Q9300の使い心地" />
    <id>tag:blog.3016.net,2008://2.284</id>
    
    <published>2008-04-30T00:26:05Z</published>
    <updated>2008-05-01T00:26:57Z</updated>
    
    <summary>メインPCの移行作業が終わりました。 さすがにBanias 1.6 GHzに比べ...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="PC" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        <![CDATA[メインPCの移行作業が終わりました。

<a href="http://blog.3016.net/080430_q9300.jpg"><img alt="080430_q9300.jpg" src="http://blog.3016.net/080430_q9300-thumb.jpg" width="300" height="225" /></a>

さすがにBanias 1.6 GHzに比べるとサクサク動きます。OSがXP(SP2)→Vista(SP1)に変わっても。まぁ、メモリはMaxまで積んでますし、速いのは当たり前ですが…
64bitWSとGAMESSで計算速度を比較しましたが、クロック比にほぼ比例(若干64bit機が速い?)という結果でした。HDDの環境が全然違いますんで(64bit機はRAID 0)、その辺で少しリードされる程度ではないかと。

気になるのは、Core TempとSpeedFan両方で、<strong>ひとつのコアだけ温度が高く表示される</strong>というところ。他の３つのコアより10℃高く表示されます。グリスを塗りなおしたり、CPUクーラーの向きを変えてインストールしたりしても変化なし…もしや<strong>ハズレ個体</strong>なのか。まぁ、通常使用に支障は全くないので(フルに計算に使っても70℃まで行かない)、気にしないことにします。でも気になる…

これで、動画エンコードをするわけでもないのに「<strong>無駄にQuadコア×2</strong>」の生活がスタートです。

追記＠14:43
kakaku.comに、Q9300の温度表示に関する似たような体験談が。
<a href="http://bbs.kakaku.com/bbs/05100011431/SortID=7739017/">http://bbs.kakaku.com/bbs/05100011431/SortID=7739017/</a>
やはり個体差があるのかな？正確なことはわかりませんが。QX9650はかなりまともな温度を表示しているように思いますが、あれも実はズレてたりして？

追記＠5/1 9:20
今回CPUクーラーとして選んだのは<a href="http://www.scythe.co.jp/cooler/ninja-mini.html">Ninja mini</a>だったのですが(<a href="http://db.cpu-cooling.net/db2?m=s&q=mGA-G33M-DS2R&n=1375">同じケース&M/Bで取り付け例があった</a>ので)、プッシュピン型の固定ってちょっと怖いですね。マザーボードが反るし(汗  Noctuaのは取り付けに手数が若干かかるものの、バックプレートを使った安心仕様だったのですが…次買うときはプッシュピン型はできれば避けたい。。。]]>
        
    </content>
</entry>
<entry>
    <title>メインPCグレードアップ計画＋α</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/04/pc_4.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=282" title="メインPCグレードアップ計画＋α" />
    <id>tag:blog.3016.net,2008://2.282</id>
    
    <published>2008-04-26T02:02:42Z</published>
    <updated>2008-04-26T02:17:51Z</updated>
    
    <summary>64bitWSに続き、メール等に使っているPCもこのGW中にグレードアップを計画...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="雑記" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        <![CDATA[64bitWSに続き、メール等に使っているPCもこのGW中にグレードアップを計画中。
CPUがPenM(Banias) 1.6GHz(!!)からC2Q Q9300(2.5GHz)になる予定。最初はPhenom X4 9100eもいいかと思ってましたが(780Gのパフォーマンスも魅力)、消費電力と性能の比を考えると、電力のレンジが実質E8500に近いQ9300が非常に魅力的に思えてきて、こちらに決定。M/BはG33のMicroATXで十分。
これで2台がQuad coreになることに。3並列で計算をやっても他の作業をする余裕があるのがいい。

…うちのブレーカー大丈夫か? (電子レンジを使った瞬間に落ちるとかないよな…)

＋αは、pc-chem.infoの更新について。
月1回ぐらいはと言っておきながら、<strong>2008年は1回も更新してません</strong>。コンテンツ作る暇がないんです。計算は時々やっていて、Sn2の一歩進んだ内容や、Monsanto Processのエネルギープロファイルなど、ある程度まとまったものもあります。この連休中にどこまでできるか…
ただ、64bitWSは別件で埋まっているので、それが終われば進捗があるかもしれません。
]]>
        
    </content>
</entry>
<entry>
    <title>GAMESSのD&amp;D実行ファイル改造</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/04/gamessdd.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=281" title="GAMESSのD&amp;D実行ファイル改造" />
    <id>tag:blog.3016.net,2008://2.281</id>
    
    <published>2008-04-19T14:01:12Z</published>
    <updated>2008-04-19T14:25:47Z</updated>
    
    <summary>備忘録です。 問題になったGAMESSのD&amp;D実行ファイルの改造ですが、ファイル...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="Chemistry" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        備忘録です。
問題になったGAMESSのD&amp;D実行ファイルの改造ですが、ファイル数制限解除と使用CPU数のファイル名からの判別について、以下に記載しておきます。

(1)ファイル数制限解除
目的は10個以上の入力ファイルを同時にD&amp;Dし、順次実行させること。普通は滅多に10個以上の入力ファイルを投入することはありませんが、私が計算を使うときは、様々なパターンの相互作用解析を実施したりする時にこれくらいの数の入力ファイルを作成して一気に計算させる時があります。まぁ、別にフォルダ内の.inpを順に実行するタイプ(pc-chem.infoで以前より記載)でも良いんですけどね…batファイルが1つ減るのと、こっちの方がプログラムとしてスマートだと思うので。

「Shift」を使います。

:start
if &apos;%1&apos;==&apos;&apos; goto end
(計算実行)
shift
goto start

:end
exit

基本的にこれだけ。入力されるファイルを順に計算してはパラメータをshiftし、shiftするものが無くなったらループを抜ける。

(2)使用CPU数のファイル名からの判別
GAMESS/PC GAMESSには並列化されていない部分もまだけっこうあります。MCQDPTやNMR、SS(V)PEなどなど…複数のプロジェクトの計算を実施する際に、並列化されている計算とされていない計算を逐次処理してほしい時があるので、勝手に判断して切り替えてくれるようにするのが私には便利です。

set seqkey=seq

set fname=%~n1
set pflag=%fname:~0,3%
if %pflag% == %seqkey% (set cpu=1) else set cpu=4

seqkeyは逐次計算のトリガーとなる文字列です。pflagは入力ファイル名の先頭3文字で、これがseqkeyと一致したらcpu数を1にセットします。seqkeyの文字数に合せてpflagの抽出文字数を変える必要があります。fnameはここでは特に意味はありませんが、実際のバッチファイルでは他の目的で使われています。
上記の場合、ファイル名の最初に「seq」を付ければ、他のファイルと混じっていてもそれだけ1 CPUでの計算になります。



        
    </content>
</entry>
<entry>
    <title>64bitWS、安定運用中。。。</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/04/64bitws.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=280" title="64bitWS、安定運用中。。。" />
    <id>tag:blog.3016.net,2008://2.280</id>
    
    <published>2008-04-14T13:38:50Z</published>
    <updated>2008-04-14T13:48:33Z</updated>
    
    <summary>スタートでいきなり躓いた64bitワークステーションの構築ですが、何とか安定運用...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="PC" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        <![CDATA[スタートでいきなり躓いた64bitワークステーションの構築ですが、何とか安定運用に漕ぎつけました。というわけで、現在のスクリーンショット↓

<a href="http://blog.3016.net/Vista_x64_screen.jpg"><img alt="Vista_x64_screen.jpg" src="http://blog.3016.net/Vista_x64_screen-thumb.jpg" width="350" height="280" /></a>

バリバリ4コアでPC GAMESSを走らせております。時間の掛かる振動計算を実施中。しかも3.00GHz→3.66GHzにOC(333x11)しての運用です。FSBと電圧をいじらずに安定運用可能な限界がここら辺でした。長時間の計算を実施しないのであれば3.83GHzまでは問題なくいけます。x12の4.00GHzはOSが立ち上がらず(コア電圧を1.33Vまで昇圧すればいけます)。
CoreTempの値が…上のSSでは見えないですね。室温20℃でピーク58℃という感じです。真夏(室温30℃)にこれをやったら70℃行っちゃう…夏は定格ですね。]]>
        
    </content>
</entry>
<entry>
    <title>新しいPCって大変…</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/03/pc_3.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=276" title="新しいPCって大変…" />
    <id>tag:blog.3016.net,2008://2.276</id>
    
    <published>2008-03-30T11:14:52Z</published>
    <updated>2008-04-01T14:24:53Z</updated>
    
    <summary>喜び勇んでx64ワークステーションを組んだわけですが、これがおそらくはメモリの相...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="PC" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        喜び勇んでx64ワークステーションを組んだわけですが、これがおそらくはメモリの相性(&amp;グラフィックカードのドライバ?)に起因すると思われるブルースクリーンに悩まされております。
PC GAMESSの計算は基本的に問題が起こらないのですが、WinGAMESSの方はMP2なんかでメモリ領域を大量に使うときに突然砂嵐に巻き込まれたり真っ青になったりと…しかもエラーの出るタイミングやメッセージはばらばら。
メモリモジュールの挿し方によって変わる(2Gx4ではなくx3とし、3枚の挿し方のパターンによって安定したりしなかったり)。落ち方を見ると、DDIがメモリ領域を展開(この言い方が正しいのかどうかはわかりませんが)するタイミングです。WinGAMESSのバイナリにも依存していないように思うので(コンパイル済みvs自分でCygwinでコンパイル、LAAのon/off)、おそらくメモリではないかと。。。ちなみにMEMTEST86+ではエラー出ません。
似たようなケースでメモリのメーカーを変えたら嘘のように安定したという報告もちらほらあるので、P5K PROで動作確認が取られているメーカーのものにしたいと思います。メモリ安くて助かった…
(→CFDのW2U800CQ-2GL5J(CFD-elixir, P5K PROで動作確認済み)で無事安定動作となりました。一安心。[08/04/01追記])
        PC GAMESSが普通に動かせるので、MP4(SDTQ)でベンチマークを取ってみました。

Xeon E5150 (2.66 GHz) x 2 ： 1701.5 sec (28.4 min) (From PC GAMESS Performance page)
C2E QX9650 (3.00 GHz) ： 1593.3 sec (26.6 min)

1.068倍高速ですが、クロック比では1.128倍ですから、伸びは悪いです。ま、OSやらチップセットやらが違いますし、細かいオプションの指定も違いますんで、その辺が影響しているかも知れませんが。

----
とりあえず、倍率変更のみですがOCしてみました。デフォルトは333x9で3.00GHzですが、これをx10.5に変更して3.50GHzにしてみました。x11はOSが立ち上がっても計算しようとすると即落ちでした。

C2E QX9650@3.50GHz ： 1419.0 sec (23.7 min)

速くなっとります。ただ、発熱は結構馬鹿になりません。ピークで65℃前後。定格より10℃上がってます。室温が16℃ぐらいなので、夏場は無理ですね。定格運用なら、室温20℃でピーク55℃前後ですので、夏場も無問題でしょう。今の季節なら、x10で3.33GHzが落としどころでしょうか。
    </content>
</entry>
<entry>
    <title>64bitワークステーションを組んでみました。</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/03/64bit.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=275" title="64bitワークステーションを組んでみました。" />
    <id>tag:blog.3016.net,2008://2.275</id>
    
    <published>2008-03-28T14:19:03Z</published>
    <updated>2008-03-28T14:32:55Z</updated>
    
    <summary>ちょっとお金が貯まったので、Core MAの計算速度を体感しようと一台PCを組み...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="PC" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        <![CDATA[ちょっとお金が貯まったので、Core MAの計算速度を体感しようと一台PCを組みました。
こいつ何するんだ？とショップ店員に訝しく思われるかもしれない構成。電力効率と静音性に配慮しつつ計算速度は高めたい、という意図でパーツを選びました。

<a href="http://blog.3016.net/64ws1.jpg"><img alt="64ws1.jpg" src="http://blog.3016.net/64ws1-thumb.jpg" width="150" height="200" /></a><a href="http://blog.3016.net/64ws2.jpg"><img alt="64ws2.jpg" src="http://blog.3016.net/64ws2-thumb.jpg" width="266" height="200" /></a>

ケースはCooler MasterのCOSMOS。E-ATXのマザーにも対応する、作業性の良い大型ケースです。音と冷却のバランスも良いのでは。中のパーツは以下の通り。

<a href="http://blog.3016.net/64ws3.jpg"><img alt="64ws3.jpg" src="http://blog.3016.net/64ws3-thumb.jpg" width="400" height="508" /></a>

CPUはQX9650。Q9000シリーズが発売になっていますが、入手性がかなり悪そうということと、QX9650はしばらく値段が下がらなそうだったので選択。TDPの印象以上に発熱が小さく、OCも楽しめそう。
HDDは発熱の小さいWD製ドライブをRAID 0で構成(計算ノードのみ)。5台積んでいますが、HDDの騒音はほぼ皆無です。
CPU coolerはNoctuaのNH-U12P。ヒートシンクがあまり重くなく、しかし冷却性能はすばらしいです。
4コアフル稼働で分子軌道計算を数時間行いましたが、CPU温度(CoreTemp読み)は50℃前後でした(室温20℃、アイドル時35℃)。

Athlon 64 X2 4400+ (OC@2.42GHz)の2コアフル稼働に対して、C2E QX9650の4コアフル稼働は3.3～4倍高速に計算を行うことができるようです。3.3GHzにOCすると、3.6～倍なので、4倍越えも出来そうな感じです。

]]>
        
    </content>
</entry>
<entry>
    <title>続・WinGAMESSの割り当てメモリ量の増量</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/03/wingamess_1.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=274" title="続・WinGAMESSの割り当てメモリ量の増量" />
    <id>tag:blog.3016.net,2008://2.274</id>
    
    <published>2008-03-28T09:28:50Z</published>
    <updated>2008-03-28T09:50:23Z</updated>
    
    <summary>備忘録です。 前回まではこちら↓ WinGAMESSの割り当てメモリ量の増量 g...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="Chemistry" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        <![CDATA[備忘録です。
前回まではこちら↓
<a href="http://blog.3016.net/2007/03/wingamess_2.html">WinGAMESSの割り当てメモリ量の増量</a>

gamess.xx.exe(xxはバージョン番号)とddikick.exeにLargeAddressAwareのフラグを立てる、という方法。
LaaTiDo (http://www.musikbanken.se/laatidosetup.exe)をDL&インストールし、GUIの指示に従ってgamess.xx.exeとddikick.exeをLAA activeに変換し、変換前のものと置き換えて実行するだけです。
runscript.cshで両ファイルの存在を確認する辺りでなぜか引っかかるので、その辺はすべてコメントアウトor削除すると、無事メモリ量の制限が大分緩められます。
Windows Vista Business x64 では、MWORDS=268まで指定可能でした(搭載物理メモリは8GB)。
]]>
        ちなみに前回は172でしたが、x64ではデフォルトではその半分しか指定できません。word単位は64bitOSと32bitOSでは倍サイズが違いますので、実に理論的に当たり前の結果。
ちなみに、PC GAMESSでは32bitでも64bitでもMWORDS=267が最大でした。これが一般向けWindowsを使う限りの限界でしょうか。
    </content>
</entry>
<entry>
    <title>直交座標が活きるとき</title>
    <link rel="alternate" type="text/html" href="http://blog.3016.net/2008/03/post_50.html" />
    <link rel="service.edit" type="application/atom+xml" href="http://port3016.sakura.ne.jp/mt/mt-atom.cgi/weblog/blog_id=2/entry_id=273" title="直交座標が活きるとき" />
    <id>tag:blog.3016.net,2008://2.273</id>
    
    <published>2008-03-09T12:40:09Z</published>
    <updated>2008-03-09T12:56:38Z</updated>
    
    <summary>備忘録。 最近、PCM(IEFPCM, CPCM)で溶媒和を考慮する計算をやって...</summary>
    <author>
        <name>s2k</name>
        <uri>http://3016.net/</uri>
    </author>
            <category term="Chemistry" />
    
    <content type="html" xml:lang="ja" xml:base="http://blog.3016.net/">
        備忘録。
最近、PCM(IEFPCM, CPCM)で溶媒和を考慮する計算をやってるんですが、構造最適化のカットオフがOPTTOL=0.0001(default)の設定で、0.0008ぐらいのところで振動というかぴくりとも構造とエネルギーが動かなくなる状態に鉢合わせました。まぁ、よくある話だよなと思いつつ、$STATPT辺りのパラメータをいじりながら詰められるかなと思っていたところ、これが思わぬ苦戦。

MOPACのCOSMOなんかでDDMIN=0.0が効くので(出力中にも「DDMIN=0.0 LETを追加してみろ」って出たりしますよね)、TRMIN=0.00なんぞにしてみたりすると、上手くいくときもたまにあるが、全く改善しない場合も多い。で、STSTEPやUPHESSを変えてみたりして何の解決にもならんので(注:あまり意味を考えずにいじってます)、そういえば、と思って最適化に使う座標系をDLCからCART(正確にはNZVAR=0にしただけ)にしたところ、あっさり解決。

座標系の選択は最適化に最も大きな影響を及ぼす因子だというのは知っていたものの、分子の構造からして直交座標が有利になることはないと思っていたんですが(※)、こういうこともあるんだと認識を新たにしました。

※GAMESSでいろいろな分子の構造最適化をしてみる限り、DLCを使って損をすることは滅多になく、普通はCARTを使うと構造の収束に時間が掛かることが多いです。非常にリジッドな分子ではその差が縮まってきます。(一般論かどうかはわかりませんが…私の経験上では)
        
    </content>
</entry>

</feed> 

