3年ぶりの駄文 悪あがきその3-1

まだ十分な安定性検証のできていない暫定仕様ですが、一応の形にはなりました。
自分用の備忘の意味も含め設定を記録。
※以下は中古購入したXeon X5460の内1個目(S-SPEC:SLBBA lotno:3834A776 固有VID:1.2500V)についての記述です。また温度に関する記述について、モニタリングツールの設定ミスでTjMax85度からのオフセットを100度からのオフセットとして読んでしまっている箇所があり信頼性に欠けます。
※現在中古CPUをもう一個(S-SPEC:SLBBA lotno:3846B015 固有VID:1.2250V)購入しそちらへ載せ換えています。2個目のCPUについてはその3-2に記載。

CPU交換前 Core2Duo E8500@4.0GHz駆動

CPU交換後 Xeon X5460@4.2GHz駆動

厳密には4199MHz駆動で4.2GHzに届いていないのはご愛嬌(笑
交換後のスクショは検証初期のFSB442MHz@CPU Vcore 1.35000V設定時*1のものです。
その後の検証結果により、常用設定はFSB432MHz@CPU Vcore 1.36875V設定としました。
以下BIOS設定メモ。


比較検証用4GHz駆動
FSB 421MHz
CPU Vcore 1.25000V -> 1.31875V
CPU PLL 1.500V -> 1.630V
CPU Reference 0.760V -> 0.800V
MCH Core 1.100V -> 1.260V
MCH Reference 0.760V -> 0.740V
DRAM Voltage 1.800V -> 1.900V
DRAM Termination/Reference 0.900V -> 0.950V

以前のC2D@4GHzでの設定メモ(id:Tommi:20100429)からのCPU変更に伴う変更点は、

  • CPU Vcoreを引き上げ。
  • CPU PLLを引き上げ。
  • CPU Referenceの設定を変更。(基準値が、Core2は0.635*VTT、Xeon5400は0.667*VTT)

コアの数は倍増していますが基本的には同じ世代・同じ定格の石なので、比較をするとVcoreを固有VID 1.2375Vから引き上げなくとも4GHzでストレステストを通ったE8500が「当たり」だったと言えるのかもしれません。
またX5460は、単にWindowsがブートしてベンチマークを廻すだけであればVcore 1.26250V設定でもほぼ動作してしまうので、「見かけ上の安定動作」ラインと「ストレステストを通る確実な安定動作」ラインの間で、必要な電圧の差が大きいようです。
またMCH Core電圧が引き上げられているのは、以前検証時のGeForce 9800GTX+よりも現在のGeForce GTX760の方がよりMCHの安定度に対しシビアなようで、MCH Core 1.220VでもCPUストレステストは通るのですが3D系ベンチマークでディスプレイドライバの応答停止と回復が発生するためその対策です。長期間のOC運用によりMCH自体が経年劣化し特性が悪化している可能性もあります。


常用4.1GHz駆動
FSB 432MHz
CPU Vcore 1.25000V -> 1.36875V
CPU Termination 1.200V -> 1.200V
CPU PLL 1.500V -> 1.690V
CPU Reference 0.760V -> 0.815V
MCH Core 1.100V -> 1.260V
MCH Reference 0.760V -> 0.740V
DRAM Voltage 1.800V -> 1.900V
DRAM Termination/Reference 0.900V -> 0.950V
CPU/PCI-E Clock Drive 700mV -> 800mV

4GHz駆動からの動作周波数向上に伴う変更点は、

  • CPU Vcoreを引き上げ。
  • CPU PLLを引き上げ。
  • CPU及びPCI ExpressのClock Driveを引き上げ。*2

動作クロックとCPUコア電圧の設定については、先にUSBメモリからブートしたMemtest86+で1passノーエラークリアするFSB・電圧設定ラインを検証した結果、FSB421MHz(4GHz駆動)まではVcoreを盛らずに1周回るものの、そこからFSB442MHz(4.2GHz駆動)までは多少の電圧を盛らないとクリアしない。FSB442MHz(4.2GHz駆動)からFSB453MHz(4.3GHz駆動)に上げようとすると、それ以下の周波数と比較して1周クリアに必要な電圧の引き上げ幅が一挙に大きくなる事が判明したため、常用設定を出すターゲット周波数をFSB442MHz(4.2GHz駆動)に設定。
Memtestを1周パスする電圧設定では、Windowsは問題なくブートするもののBOINC(SETI@home)でCPUに負荷をかけると数秒でBSoD(爆)となるため、とりあえずBOINCが安定動作する(しているように見える/BSoDしない/検算エラーはともかく計算エラーの発生はない)ところまでVcoreを引き上げた結果現在の設定に至る
->その後FSB442MHzでどうにか安定させられないかとしばらく試行錯誤していたのですが、BSoDの発生こそ無いもののアプリケーションレベルの細かいエラーがちょこちょこ記録される状況を打破できず、実際のところ高負荷時に「安定動作」させるのに必要なVcore電圧がいくつなのか、1ステップずつ設定を変更しながらPrime95を回して、エラー検出によるテスト中断が発生しないラインを検証しています。一度10時間以上エラーが出ずに廻ったので大丈夫かと思ったら3D Markがエラーで落ちて、もう一度Prime廻したら今度は3時間持たない、みたいなケースが多く中々安定ラインにたどり着きません。。。

但し数時間以上安定して動作しているように見えても、目を離して一晩寝たら落ちている(所謂OCに起因するKP41病w)こともあるので、もう少し微調整が必要っぽい。Vcoreを更にもうちょい盛るのが正解か、PLLをもうちょい盛るのが正解か、MCHをもうちょい盛るのが正解か、はたまた複数箇所に盛らないと「安定」の域にはまだ遠いのか。。。C2Dで試行錯誤した時の経験上、CPU Terminationは設定値をいじると他が連動してずれることで検証がクソめんどくさくなる上に、少なくともCPU Vcore定格設定では動作安定度を改善する目的でほぼ有意差がみられず*3いじる価値はないと思っていたのですがこれも果たして4コアのXeonに通用するのか。。。何れにせよこの先はどうしても検証に時間を要す段階になり。(上記電圧設定値についても検証結果により随時更新しています。)
->CPU4.2GHzで常用設定を出すにあたりCPU Vcoreの設定を上げているのですが、以前のC2D@4GHz(Vcore定格設定)ではいじっていなかったCPU Terminationも上げてやったほうが安定動作するようです。判断基準がファクトリーOCのGTX760がディスプレイドライバの応答停止を起こすか、で見てる時点で影響度を正確に判断できていない疑惑はあるのですが・・・
->再検証の結果、CPU Terminationの引き上げは動作安定性向上に必ずしも寄与しないようなのでデフォルトに戻しました。CPU PLL/MCH Core等の電圧が不足した状態では、CPU Terminationを引き上げたほうが一見安定するように見える場合もあるのですが、連動してずれてしまうReference電圧の影響による変化の方が大きいようです。またCPU Termination 1.200V〜1.280Vの間では動作安定度に有意差は見られないのですが、1.300V設定ではCPU PLL/Referenceに余分に電圧を盛らないと安定しなくなる、1.320V設定以上では他に電圧を盛ってもOSブートにコケるなど逆に不安定化する場合もあるようです。
->連動してずれるRefernce電圧がなるべく近い数値となるよう設定して再々検証。比較的軽めの負荷の場合有意差はごくわずかですが、CPU Termination設定1.260V>1.240V>1.280V>1.220V>1.200V>1.300V>>1.320Vの順で動作安定度に影響はあるようです。またPrime95等の重い負荷の場合、1.240V以下の設定ではランダムなBSoDが発生します。
->BSoD発生の原因はCPU Terminationの電圧不足ではなく、正しくはCPU Termination電圧設定に対してCPU Reference電圧の設定が適切ではない事によるものだったようです。Referenceを連動させて下げればTerminationを下げてもBSoD発生を確認できず。検証中見られた安定度の変化も結局はTermination電圧の変更による変化ではなくTerminationとReferenceの比率による安定度変化の再検証になっていたようです。

CPU Refernce電圧の設定は、当初はCPU PLL電圧設定値の1/2を目安に試行錯誤していたのですが、PLLを高めに設定しないとなかなか安定しない。そこでXeon X5400シリーズのデータシートを改めて確認したところ、Refernce電圧についてTyp 0.667*VTT、Min,Maxは±2%との記述を発見。これはCPU Termination 1.200V設定時、CPU Refernceは0.784Vmin-0.800Vtyp-0.817Vmaxが基準値となり、BIOS表示上のデフォルト電圧である0.760V(Core2の基準値である0.635*VTT)とは異なると判明。実際に他の電圧設定を固定しCPU Refernceだけを上下させてみたところ、CPU Terminationの0.66〜0.68倍の設定が最も安定し、それより低いとランダムなタイミングでBSoDが発生し動作が不安定になる、高め設定も低めよりはマシなものの同様な傾向と判明。またCPU Termination 1.200V設定では0.68*VTTが最も安定し、CPU Termination 1.280V設定では0.66*VTTが最も安定する、Termination設定がその中間では0.66*VTTでも0.68*VTTでもどちらでも安定するが、その範囲を少しでも外すと程度の差はあれ動作が不安定になるようです。

MCH Referenceについては、他の電圧設定も何パターンか変えて試してみましたが、Vcore&PLLギリギリ設定でのBSoD発生までの時間・頻度から簡易的に安定度を判定すると0.740V>0.720V>0.760Vなイメージで安定度が変化するので、やはり下げたほうが良い、気がする。但しこの場合BSoD発生の主原因は「Vcore or PLLの電圧不足」なので、MCH Referenceの設定が本当に影響を及ぼしているのかはやや疑問符がつきますが。
->CPU Termination 1.280V、その他電圧盛り気味設定でMCH Referenceを変化させると、MCH Coreが1.300V以上の設定の場合、MCH Reference設定の動作安定度への影響は見られないが、それ以下では0.730V>0.710V>0.750Vの順で安定度に差が出る。特に0.750V設定はMCH Core 1.260V設定時にOSブートがコケる場合があるなど明らかに不安定(MCH Reference 0.730V設定ならMCH Core 1.240V設定でもOSは問題なくブートする)ので、下げたほうがより安定動作する事は確かなようです。これは単に下げたほうが良いというより、安定動作する範囲が0.725V〜0.745Vの狭い範囲に限定されているといった方がより正確な印象。

今回は他を緩めて電圧をガッツリ盛った1発設定で、CPU単体どこまで回るかみたいな限界チェックはしていません。またCPU側のOC設定を出すにあたり、GTX760はBIOS書き換えでギリギリ狙いOCをしていた*4ものをASUSファクトリーOCのBIOSに戻しています。
//KP41病が収まったら次はnvlddmkmが来そうな悪寒((((;゚Д゚))))
->検証開始ラインのVcore 1.35000V、PLL 1.590V設定から、Vcore 1.37500V、PLL 1.610Vに引き上げたところでKP41病の再発はなくなった模様。で、予測通りnvlddmkmが来ましたよ。。。PLLを更に盛って1.670Vまで上げたところで今のところは落ち着いていますが、、、またしばらく様子見ですね。
->GeForce Game Ready Driverを385.12 BETAから385.28 WHQLにしたらnvlddmkmは出なくなってKP41が出るようになた。なんじゃこら(笑->いずれにせよGPUクロック上げ過ぎだったっぽ?
->CPU Terminationもいじり始め、影響を判断するのにCPU Vcoreは一度1.35000Vまで落としてみています。ダメならもう一度Vcoreも盛って検証、もしイケるならPLLやMCHを更に落とせないか検証ですね->落とすとダメっぽいので1.37500Vに戻しました。VcoreとTerminationはこれで決め打ちにして次はPLLとMCHを落としていけるか検証〜。。。もうこれ以上落とせない気がするけど・・・

//追記・GPUネタに脱線->長くなって読みづらくなったのでその5として切り離し(id:Tommi:20170821)

交換前のE8500@4GHz駆動では、室温約30度時*5BOINCで連続高負荷をかけた際のコア温度が65度前後(Afterbuener読み)で収まっていたのですが、流石に物理コア数2倍で動作クロック・コア電圧が上昇していることもあってかX5460@4.2GHz駆動で同等条件のコア温度を見ると90度前後*6まで上昇。それもコールドスタートから2,3分で80度ちょいに上がった後に、十数分かけて90度前後までじわじわ上がりその後は概ね安定する、明らかに窒息ケース*7起因の症状もあり・・・温度的にも常用するのはこのあたりのクロックが限界でしょう。
CPUクーラーのすぐ脇にある、ケースリアの排気ファンをガッツリうるさいやつに交換すれば2,3度安定時温度が下がることは確実っぽいのですが、あまり排気を強くするとケース内圧が下がり防塵フィルタ付きフロントファン以外の隙間からの吸気量が増えホコリ掃除の手間が増えることも確実っぽいのでここは目をつぶりますw逆にケースフロントの吸気ファンを強化することも考えたのですが、おそらく騒音量の増加に見合う効果は期待できないでしょうしやはり目をつぶりますwwwそもそもケースファンが8cmでフロント2基リア2基の古臭い設計で、すでにフロント3000rpmリア2500rpmのそれなりに風量のあるファンがついているので、これ以上の爆音大風量ファンとなると入手性まで考慮した選択肢*8は限られますし。
//サイドパネルを一部ぶち抜いて風神匠直上に追加で12cmの吸気ファンを追加する方向で検討中。
->増設しました。風神匠に装着している2連RDL1238S-PWMのちょうど中間に重なるように逆回転タイプのRDH1225S(24LN)を装着。サイドパネル開放時に対し更に2,3度程度コア温度を低下させることに成功。高負荷時でも80度を切るぐらいに収まりました。同じようにBOINCで連続高負荷をかけていても、増設前はサイドパネルの開閉状況によらず一度上がりきった温度は負荷が連続している間ほとんど下がらなかったのに対し、増設後は処理内容によって(?)発熱が減少した際最大で5度程度速やかに温度が下がるようになりました。
->以前は吸気8cm3000rpmx2に対し排気12cm1300rpmMAX(PSU)+8cm2500rpmx2でトータルでは排気が勝っていた状況に対し、サイドパネルファン増設後は12cm2400rpmが追加されかなり吸気が勝っている様子だったので、8cmのケースファンを前後(吸排気)入れ替えて調整してみました。吸気12cm2400rpm+8cm2500rpmx2、排気12cm1300rpmMAX+8cm3000rpmx2ですがまだ吸気が勝っているようです。調整前後でCPUコア温度はほぼ変化していないように見えますが、GPUコアの負荷が低下した際の冷却速度がやや早くなった気がします。

DRAM動作レイテンシ周りの設定は、BIOS上でPerformance EnhanceをStandardに設定してXMPから読み込まれた数値を基本に手動で設定し固定。その他、
tRFC 52->54

FSB/CPU動作クロックの上昇は概ね5%ですが、冒頭に掲載したベンチマークスクリーンショットを見るとシングルスレッド性能で6%程度の性能上昇。長いことクリーンインストールせずに使い続けたWindows8.1を今回の試行錯誤の中でクリーンインストールしたためその影響と推測。
ベンチマークの結果だけで評価をすると、2C2TのCore2DuoはOC込みでも少々性能的に厳しい部分も見え始めていたところ、今回の交換でちょっと前のCore i5Sandy Bridgeの2400とか)の定格動作と同等程度というなんとも微妙なラインに性能上昇しました。現行世代のCore i3(Kabylake 7350K)と比較しても、シングルスレッド性能では明確な差をつけられていますがマルチでは2C4Tのi3に対し4C4TでMP Retioの落ち込みがない分でギリギリ逆転。これでまだ当分は戦える!?ということにしておきます。
//Coffeelakeがでたらi3でも4C4Tらしいので相手にならなそうだけど。

ちなみに、その1(id:Tommi:20170725)に書いたゲーム中のCPUボトルネック症状ですが、ゲームエンジンが多スレッドに対応しておらず、2コアが4コアになった結果使用率100%張り付きが使用率50%付近をウロウロになっただけで、フレームレートはわずかしか改善しませんでした。残念w

LGA775ソケットなマザーにLGA771なCPUを載せたことにまつわる試行錯誤は、書く気になったらそのうち書くかもしれません書かないかもしれません。
今回はここまで。

*1:CPU-Zの表示電圧はBIOS上での設定値とズレます。

*2:Load Optimized Defaultで読み込まれる数値はCPU Clock Drive 800mVとPCI Express Clock Drive 900mVですが、このクロックドライブ電圧は規格上CPUもPCI-Eも共に710mVtyp-850mVmaxとなっており、900mVは常用前提の空冷OCではおそらく過電圧です。クロックドライブ900-1000mV設定は、複数枚のグラボをSLI/CrossFire接続してOC運用する場合や、LN2でブン廻す1発仕様のOC以外ではほぼ無意味と思われます。

*3:C2D@4GHzだと下手にCPU Terminationを盛ると逆に安定しなくなる場合もありましたし。電圧フルオート設定でOCした時にあまり伸びずに頭打ちになる場合の原因の一つがオートで盛られ過ぎてしまったCPU Terminationだと思っていたり。

*4:CPU載せ替え前はASUSファクトリーOC設定からさらにGPUコアクロックブースト+3段、VRAM 3305MHz設定でした。この設定にした当初は2ヶ月ぐらいイベントログも特に記録されず安定してるかと思っていたのですが、その後は月1程度のペースでディスププレイドライバの応答停止と回復が記録されるようになり・・・面倒だったのでそのまま使っていました。

*5:エアコンで室温を下げることも可能なのですが、悪条件下での安定性確認が目的なので夏場の室温高め環境で30度です。単に自分がエアコン嫌いで最小限しか動かしてないのもあるのですが。

*6:4.2GHz駆動だと電圧設定がダイレクトに温度上昇につながります。Vcoreを0.01250V上げるとコア温度が2,3度上昇する感じ。

*7:どれだけ窒息したケースかと一度試してみたら、サイドパネル開放時と閉塞時でコア温度が10度変わりました..._no

*8:自作PC用のパーツとして多く流通してる製品でぱっと思いつくのはXINRUILIANの4000rpmのやつぐらい?電源コネクタ無しでいいならもっと色々ありそうなんですが・・・