1 ポイント 投稿者 GN⁺ 2024-02-25 | 1件のコメント | WhatsAppで共有

Intelプロセッサの不安定性によるOodle展開失敗

  • RADは、Unreal Engineで作られたゲームでOodle Dataの展開失敗またはクラッシュを引き起こす可能性がある問題を認識している。
  • この問題は主にIntel 13900Kおよび14900Kプロセッサに影響し、13700、14700および関連プロセッサへの影響は比較的小さい。
  • こうしたプロセッサのうち、この挙動を示すのはごく一部に限られる。
  • 問題は、BIOS設定とこれらのプロセッサの高いクロック速度および電力使用量の組み合わせによって発生し、高負荷時にシステムの不安定性や予測不能な動作を招く。

ソフトウェアバグではなくハードウェア問題

  • OodleやUnrealにあるソフトウェアバグがこの問題を引き起こしているわけではないとみられる。
  • BIOS設定が過度に楽観的であるため、一部のプロセッサは高負荷時に動作範囲を外れ、クロック速度や消費電力の影響で誤った命令を実行してしまう。
  • Oodle Dataの展開では追加のデータ整合性チェックを行う必要があるため、他のゲームプレイ、シミュレーション、オーディオ、レンダリングコードとは異なり、不整合を非常に素早く検出する。

Unreal Engineベースのゲーム起動時によくある失敗の種類

  • 最も一般的な失敗の種類は、"DecompressShader(): Could not decompress shader (GetShaderCompressionFormat=Oodle)" というエラーメッセージである。
  • この問題はOodleだけに影響するものではなく、こうした不安定性を抱えるシステムは標準的なベンチマークやストレステストプログラムでも失敗を示す。
  • 多数のスレッドでプロセッサを集中的に使用するプログラムは、クラッシュや予測不能な動作を引き起こす可能性がある。

問題解決のための回避策

  • 正確な原因や最善の解決策を診断するためのプロセッサ情報にはアクセスできない。
  • 多くのマザーボード/BIOSメーカーは、プロセッサを安全動作範囲外へ押し出す設定で出荷している。
  • 影響を受けるのは少数のプロセッサのみであるため、一部のユーザーはメーカーにプロセッサを返品し、問題のない新しいプロセッサを受け取ることに成功している。
  • ほかの回避策では、チューニングユーティリティの使用やBIOS設定の変更が必要になる。
  • Intel XTUを使ってPerformance Core Multiplierをx55からx54またはx53へ下げることが、多くの人にとって有効な解決策として報告されている。

BIOS設定変更の推奨事項

  • オーバークロックが有効になっている場合は無効化し、「AI」または「自動」オーバークロックの使用は避ける。
  • ark.intel.comで対象プロセッサの正しい制限値を確認し、電力制限と電圧をIntel推奨の安全範囲に設定する。
  • 「ASUS MultiCore Enhancement」や「ASUS Performance Enhancement 3.0」のようなBIOSの「強化ターボ」または「強化マルチスレッディング」設定を無効化する。

Intel、ASUS、Gigabyte、MSIマザーボード向けの追加トラブルシューティング手順

  • Intel XTUをインストールし、AVX2テストを実行する。
  • AVX2テストで失敗した場合は、ASUS、Gigabyte、MSIマザーボード向けの特定のBIOS設定変更を試す。

エンドユーザーへの直接サポートは不可

  • この問題の影響を受けるゲームのエンドユーザーを直接サポートすることはできず、ゲームパブリッシャー、プロセッサメーカー、マザーボードメーカーの公式サポートチャネルを利用することを推奨する。

GN⁺の見解

  • この問題は特定のIntelプロセッサを使用するユーザーにとって重要であり、システムの安定性のためにBIOS設定の調整が必要になる可能性がある。
  • BIOS設定の変更にはリスクが伴う可能性があるため、ユーザーは注意を払い、公式サポートを受けるのが望ましい。
  • この記事は、ハードウェア問題に起因するソフトウェアエラーを解決するための具体的な対処を示しており、技術的な問題に直面したユーザーに有用な情報を提供している。

1件のコメント

 
GN⁺ 2024-02-25
Hacker Newsの意見
  • AMD Threadripper 3970Xの使用経験に関連する問題解決の過程を共有している。AMDと数か月にわたって協力して問題を調査し、AMDから補償を受けた。最終的にAMDが提供したカスタムBIOSイメージを使用してシステムを運用中。問題はGigabyteの責任であるように見える。
  • Intel 13900k CPUに欠陥があり、デフォルト設定の使用時に問題が発生した。システムが頻繁にクラッシュし、問題解決のために多くの時間を費やした。CPUを交換し、IntelにRMA(返品修理サービス)を依頼したが、IntelはLinuxサポートを理由にRMAを避けようとした。欧州の消費者保護機関を通じてRMAを進め、新しいシステムを購入して既存システムを売却した。今後はIntel製品を購入しない予定。
  • ハイパースレッディング、ターボモード、Cステート、効率コアなどを無効化してセキュリティ問題を緩和しなければならないが、そうすると20年前の機能セットに戻るのと同じだと皮肉交じりに述べている。
  • i9 149kf CPUとAsus Formulaマザーボードを使って新しいシステムを構築したが、安定運用に至るまで苦労した。デフォルト設定ではゲームのクラッシュ、カーネルやemacsのコンパイル失敗などの問題が発生した。ターボを5.4GHzに制限し、最大ワット数と温度を制限する設定を有効にしてシステムを安定化させた。現在は安定しているが、宣伝された性能を完全には活用できていないことに残念さを示している。
  • Raymond Chenの古典的な記事を思い起こさせる内容だと言及している。
  • 過去のPentium III 1.13 GHz CPUの問題を振り返っている。
  • Zstdの展開器はネットワーク経由で転送されたデータと最初に相互作用することが多く、ビット反転に非常に敏感である。エラーチェックを有効にしていても、他のプロセスより頻繁にハードウェア問題を検出する。Zstdは元データのチェックサムのみを含めてデータ完全性を保証するため、圧縮データの破損有無を判断しにくくしている。
  • "oodle"エラーログを追跡しようとするユーザーからの望まれない苦情に対応するために作られたページのように見える。これは2006年のSQLiteの事例を思い出させる。
  • ASUS TUFマザーボードを購入した経験を共有している。基本的な機能を求めていたが、BIOS設定が過度なオーバークロックを誘導しており、RAMタイミング設定を含む複数の設定を手動で調整する必要があった。
  • Epic GamesがRADを買収していたことに驚きを示している。