富士通のPC「AH52/G2」のNVMe SSD故障事例とその原因を考察

古賀竜一

古賀竜一

テーマ:ITサポートの事例と実例

1.起動しないNVMe SSD



先日、購入後3年が経過している富士通のノートパソコン「AH52/G2」が起動しないというご相談がありました。

画面にはエラーメッセージが表示されていました。

エラーコードは「E104-1-1001」
診断結果は「ハードディスクに機械的なトラブルの可能性があります。」

と表示されています。

表示内容から内蔵ストレージ(SSD)の故障が疑われました。

まず本当にSSDが原因かどうかを確かめるため、USBメモリから診断ツールやLinuxを起動しようとしましたが、どちらも起動エラーで動作しません。

次に、BIOS(パソコンの基本設定画面)から「セキュアブート」という起動制限の設定を外そうとすると、その項目がグレーアウトして変更できない状態になっていました。

このあたりから、BIOS自体に問題が起きている疑いが出てきました。

そこでPCを分解し、マザーボード上の小型バッテリー(CMOS用)と内蔵バッテリーを両方取り外してしばらく放置し、BIOS設定を初期化しました。

元に戻してBIOSを起動すると、無事に設定がリセットされてセキュアブートを解除できました。

その状態でLinuxを起動してSSDを確認しましたが、ディスク自体は認識しているようです。

起動時の診断でストレージの故障が確認されていたため、念のため新しいSSDに交換してWindows 11を再インストールしたところ、PCの動作は正常に戻りました。

その後、富士通のサポートサイトでこの機種の情報を確認すると、最新のBIOS更新プログラムが公開されていたので、その更新内容が今回のトラブルと関係している可能性も考えられたため、あわせて適用しました。

2.取り出した故障SSDで何が起きていたか


このPCには、SAMSUNG製のPM991a 512GB NVMe SSDが搭載されていました。

外付けのUSBケースに入れて複数メーカーのアダプターで検証したところ、SMART値には特に問題はありませんでした。しかし、1点気になる個所として温度表示がマイナス177度という異常値が出ていました。

ディスクを開こうとするとBitlockerのキーを求められたので、依頼者から預かっていたMicrosoftアカウントに保存されていた回復キーを入力するも、キーが違うというエラーで開けません。

正規の回復キーを入力してもBitLockerによる暗号化が解除できなかったことも、SSD内部のデータが正常に読み出せない状態にあった可能性を示しています。BitLockerの復号に失敗する原因はキーの誤りかデータの読み出し不能が主な原因となります。

キーが正しいと信頼できる場合、SSD内部でデータを正常に読み出せない状態にあった可能性が高く、ハードウェア故障またはSSD内部ファームウェアの異常が疑われます。

このNVMe SSDは故障している可能性が非常に高いと判断。

データ消去のための作業を試みたところ、以下3つの異常な挙動が確認されました

① ゼロ書き込みの即時停止

SSD全体にゼロデータを書き込んで初期化する処理(ゼロイレース)を開始すると、ほぼ直後にエラーで強制終了する。

② 約6GB地点でのハングアップ

NTFSでフォーマット後、約7GBのダミーデータを転送すると、約6GB消化した時点で書き込み速度がゼロになり、USB接続自体が切断される。

③ SMARTの温度表示が「マイナス177℃」を示す

切断直後にSMARTと呼ばれる自己診断情報を確認すると、温度がマイナス177℃以上という物理的にあり得ない数値を表示する。一方で、「健康度」は「正常 95%」と表示されていた。

この状態は、USB変換アダプタを別のものに変えても同様で、その場合ではマイナス90℃と表示された。

3.なぜ「約6GB地点」で止まるのか


消去も書き込みも、同じ約6GB地点で止まる点が重要な手がかりです。SSDには書き込みを高速化するための一時的な領域(pSLCキャッシュ)があります。

今回搭載されていたPM991aの場合、pSLCキャッシュ容量付近で障害が発生している可能性も考えられます

ただし正常なSSDであれば、キャッシュが尽きた後も速度は落ちながらも書き込みは継続します。今回のように完全に停止してUSB接続ごと切断されるという挙動は、キャッシュ枯渇だけでは説明できません。

より自然な解釈は、SSDの制御チップ(コントローラー)が損傷しており、キャッシュが切れて処理モードが変わる瞬間、コントローラーが耐えきれずに完全にフリーズする状態になっていたというものです。

4.なぜ「マイナス温度」が表示されるのか


また、このNVMe SSDを別のUSBアダプタに差し替えると今度は「マイナス90℃」と表示されました。

コントローラーがフリーズすると、PC側との通信が完全に破綻します。その際、意味をなさない不定のデータが温度の値として送られてきます。

実際に今回の検証では、異なるUSBアダプターを使った場合にそれぞれ『マイナス177℃』『マイナス90℃』と異なる数値が表示されました。

正常なSSDであればアダプターが変わっても同じ値を示すはずであり、値がアダプターによって異なるという事実は、コントローラーが毎回異なるゴミデータを返している状態、すなわち通信が根本的に破綻していることの証拠といえます。

5.SMART「正常95%」が示す診断の限界


ここで重要な点があります。「SMARTが正常と表示している=ハードウェアは健全」とは必ずしも言えません。

SMARTは過去の書き込み量や不良箇所の累積記録を読み出す仕組みです。

今回のようにコントローラーが突発的にフリーズする物理的な故障の場合、SSD自身が「エラーが発生した」という記録を内部に書き込む前にシステムが停止してしまいます。そのためログには異常が残らず「正常」に見えてしまう、という記録の限界が生じます。

「SMARTが正常でも、実際には壊れている」という状況は現実に起こり得ます。SSDの健康状態を確認する際は、SMARTの数値だけを過信せず、実際に読み書きの動作で確認する必要があります。

6.故障の背景として考えられること


BIOSとSSDの関係について

今回の修理後、富士通のサポートサイトで公開されている改版履歴を確認したところ、出荷時(バージョン1.08)から現在までに複数回の更新が行われていました。

注目すべき点として、バッテリーの制御変更が3回(1.09・1.13・1.16)、内蔵ファンの制御変更が1回(1.15) 行われています。バッテリー制御の繰り返し変更は、出荷時BIOSの電力管理設計に改善の余地があったことを示唆します。またファン制御の変更は、筐体内部の熱管理に何らかの改善すべき問題があったことをうかがわせます。

ただし、改版履歴にはSSDやNVMeスロットへの電力供給に直接言及した修正項目はありませんでした。「BIOSの電力管理バグがSSDを損傷させた」と断定できる根拠は現時点では確認できていません。

セキュアブートの設定が変更できなかったのは、BIOSの問題ではなく異常なSSDのコントローラ挙動でBIOSがロックされたためです。つまり、SSDのトラブルにBIOSが巻き込まれたためといえます。

より可能性が高い原因

現時点で最も可能性が高い原因として考えられるのは以下の組み合わせです。

① SSDコントローラーの経年劣化・個体差

3年という使用年数の中で、コントローラーが自然に限界を迎えた可能性があります。

PM991aはOEM向けモデルであり、市販向けSSDのように詳細な設計情報や耐久性に関する情報が広く公開されていないため、寿命特性については不明な部分もあります。

② 熱ストレスの蓄積

ファン制御の変更が行われていたことから、出荷時の冷却設計が最適でなかった可能性があります。

それとは別に、3年の使用でファンとヒートシンクにはホコリがたまっていたので清掃しましたが、以前から放熱が弱くなっていた可能性があります。SSDへの継続的な熱ストレスが、コントローラーの寿命を縮めた一因となっていた可能性は考えられます。

③ 電力管理の間接的な影響

バッテリー制御が複数回にわたって修正されている点から、出荷時の電力管理が完全に安定していなかった可能性は残ります。

SSDへの直接的な影響を示す証拠はありませんが、間接的な要因の一つとして完全には排除できません。

ネット上の類似報告について

富士通製PCにおいて使用期間が短いにもかかわらず同様のSSD故障が報告されている事例がネットで報告されています。私も以前にサポート事例で富士通製デスクトップPCでNVMe SSDの早期故障に遭遇しています。

機種依存性の問題である可能性も考えられます。

機種依存性については以下の過去のコラムも参考にしてください。

「検索で同じ機種、同症状の記事がたくさん!パソコン・タブレット「機種依存性の故障」とは」

https://mbp-japan.com/saga/pc-pro/column/4008428/

7.購入直後のBIOSアップデートは要確認


事例のPCでは、出荷時BIOSから現在までに電力管理や熱制御を含む複数の改善が行われていました。購入直後または初期セットアップの段階で最新BIOSを適用しておくことで、使用中のトラブルが回避できる場合があります。

特に富士通をはじめ独自BIOSを採用するメーカー製PCでは、発売後のBIOS更新によって完成度が高められていく傾向も見られます。購入後は定期的にサポートサイトを確認し、最新BIOSを適用しておくと安心です。

8.使用中の異常を感知したら放置しない


ストレージの場合、SMART値が正常というだけで安心はできません。今回のようにSMARTの数値だけでは検出できない故障もあります。

SSDは内部でNANDフラッシュメモリとコントローラーが連携して動作しています。SMARTの健康度は主にNANDの劣化状況を示す指標であり、コントローラーやファームウェアの異常を十分に反映できない場合があります。

年数が経過したSSDのPCで、起動時のエラーや使用中のハングアップが起き始めた場合、そのまま使用を継続することは推奨されません。

必ず、ある程度の容量転送を行ってみて動作に異常がないか、怪しい挙動がないかなど確認を行うことが必要です。

9.まとめ:SSDのPCでのデータのバックアップ

今回の事例のようにSSDの故障は予告なく突然発生することがあります。重要なデータは定期的に外部ストレージやクラウドにバックアップして備えておくことが肝要です。

筆者の実績 :http://www.kumin.ne.jp/kiw/#ss

\プロのサービスをここから予約・申込みできます/

古賀竜一プロのサービスメニューを見る

リンクをコピーしました

Mybestpro Members

古賀竜一
専門家

古賀竜一(システムエンジニア)

九州インターワークス

ITのユーザーサポートの現場で実際に問題を解決しながら、ITの最新の状況とその問題点を追及している専門家です。多様で複雑になってきたITのことをユーザーにわかりやすく丁寧にお伝えします。

古賀竜一プロは九州朝日放送が厳正なる審査をした登録専門家です

関連するコラム

プロのおすすめするコラム

コラムテーマ

コラム一覧に戻る

プロのインタビューを読む

コンピューターサポートのプロ

古賀竜一プロへの仕事の相談・依頼

仕事の相談・依頼