ASUS Strix 3090、ネジ1本でVRMが焼ける欠陥

ハイエンドGPUの分解整備で、シュラウドのネジ1本がVRM全体を巻き込んで壊す事故が後を絶たない。設計の余裕のなさが、ユーザーの自衛では塞ぎきれない領域に達している。該当製品は中古市場で現役だ。

ASUS Strix 3090、ネジ1本でVRMが焼ける欠陥
northwestrepair

ハイエンドGPUの分解整備で、シュラウドのネジ1本がVRM全体を巻き込んで壊す事故が後を絶たない。設計の余裕のなさが、ユーザーの自衛では塞ぎきれない領域に達している。該当製品は中古市場で現役だ。


ネジ1本でハイエンドGPUが動かなくなる

10万円を超えるグラフィックスカードが、長さ1mmほど長いネジ1本で動かない基板に変わってしまう。そんな事態がASUS Strix RTX 3090で起きている。報告しているのはGPU修理で知られるYouTubeチャンネル northwestrepairで、「Common problem with Asus STRIX 3090(screw of death)」と題した動画で患部と修理過程を細かく公開した。「死のネジ」という名づけが冗談に聞こえないあたりが厄介だ。

問題の場所は、カード側面に取り付けられた「GeForce RTX」と刻印された小さな飾りパネル。これを固定する2本のネジが、PCB(基板)の信号配線まで達するほど深い位置にある。熱伝導パッドの交換などで一度シュラウド(外装カバー)を外し、再び組み立てる際にネジを少し強く締めると、ネジ先端が基板の銅箔層を貫通し、12V電源ラインをショートさせる。動画の冒頭で技術者のTony氏は「工場出荷時から長すぎることが多い。まるでASUSがこう壊れるよう設計したかのようだ」と皮肉を口にしている。

動画では、ネジが基板の数層に食い込んで複数の配線をショートさせ、ドライバMOSFETが過電圧で焼損し、VRM側の連鎖故障へとつながる過程が映像で示される。


「死のネジ」が破壊するもの

VRM(Voltage Regulator Module、電圧レギュレータモジュール)は、電源ユニットから来る12VをGPUコアが必要とする1V前後まで降圧する回路だ。ここが壊れるとGPUコアに過電圧が流れ込み、最悪の場合コアそのものが回復不能な損傷を受ける。

Strix RTX 3090の事例では、PWM信号やフィードバック信号の配線がショートしたことでドライバMOSFETが暴走し、隣のMOSFETまで連鎖的に焼ける構図になっている。 1個の故障が4個の故障 に膨らむ流れだ。

修理動画の中で印象的なのは、Tony氏がASUSの12V保護ヒューズの不在を設計判断として指摘していることだ。ヒューズが1個入っていれば、ショートが発生した瞬間に電流を遮断してMOSFETの巻き添えを防げる。部品コストはごくわずかで、基板面積もほとんど取らない。それを省いた結果、ネジ1本のミスで数個の電源部品が一斉に焼ける構造になっている。

修理の道のりは長い。Tony氏は最終的にドライバMOSFETを3個とフェーズコントローラを1個交換し、損傷した銅配線を1本ずつ手作業で修復した。途中、コントローラを90度回転させて取り付けてしまうという技術者本人のミスもあり、自虐的に「これがルイスの店なら昨日のうちにクビだ」と笑う場面もある。それでも最終的にカードは生き返り、GPUコアは無事だった。一般のユーザーがこの作業を再現するのは現実的ではない。

ドライバMOSFETは、PWMコントローラからの信号でハイサイドFETとローサイドFETを交互にオン・オフし、12Vを1V前後まで降圧する役割を担う。これが1個壊れるとフェーズが1つ落ちるだけだが、PWM信号配線がショートすると隣接フェーズまで巻き込まれる。Strix 3090の事故はまさにこのパターンで連鎖した。

ユーザーの自衛では塞ぎきれない領域

動画のコメント欄を読むと、この問題が一人のユーザーの不運ではないことがはっきり分かる。

Strix 3090で同じことが起きた。標準的な熱伝導再塗布のあと、RTXロゴのプラスチックパネルを2本のネジで戻しただけ。締めすぎていない、止まる位置で止めただけだ。それでもこうなった。ASUSが供給したネジが長すぎる。

これは「@mattforeman4508」氏の証言だ。同氏は再発防止のため、ネジが基板に届かないようワッシャー(座金)を2枚噛ませているという。別のユーザー「@Helifax19」氏は、設計責任の所在を冷静に整理している。

確かにオーナーは自分が何をしているか分かっていた。それでも責められるべきはASUS側だ。基板を貫通しうるネジを許容する設計を出したのは製造側で、これは100%メーカー側の責任だ。

「カスタム水冷を組むくらいの自作経験者」が口を揃えて「これは普通の許容設計じゃない」と言っている。普通に組み立てた人が普通に基板を壊す設計は、もう注意喚起では済まない領域に入っている。熱伝導パッドの交換は、保証期間を過ぎたカードでは多くのオーナーが行う一般的なメンテナンスで、特別な技能は要らない。それが致命的な分解作業に化けるのは、製品の側に問題があると見るのが筋に近い。


「修理して直った」では済まない構造

ASUS側がこの設計を意図的に選んだのか、許容範囲の見積もりが甘かったのかは現時点では分からない。ただ、Strix RTX 3090は2020年の発売から5年以上が経ち、保証も大半のユーザーで切れている。熱伝導パッドが寿命を迎えてメンテナンスを始めるオーナーがこれから増える時期で、被害報告がさらに積み上がる懸念は残る。

中古市場でStrix RTX 3090を検討している人には、この情報は無視できない要素になる。前オーナーがすでに分解整備を行っていれば、ネジを締めすぎていないかは外から判別できない。基板の損傷は微小で、テスターを当てない限り潜伏する。買った直後は動いていても、ある日突然12Vラインが落ちる可能性が残る。

被害を防ぐ方法はシンプルだ。シュラウドを外す前にネジの長さを実測する、再組み立て時にワッシャーを噛ませて締め込みを浅くする、そもそも分解整備を信頼できる修理業者に出す。この3つで多くの事故は避けられる。

Tony氏は動画の最後で、教訓を「Consequences」(結末)の一語で締めくくった。買った人の技術習熟度を超えた精密さを製品の側が要求するなら、その重さはユーザーには背負いきれない。


参照元

関連記事

Read more

人口7000人の町に東京ドーム18個分のAIデータセンター

人口7000人の町に東京ドーム18個分のAIデータセンター

ペンシルベニア州の人口7000人の小さな町に、6つのAIデータセンター群が建設されようとしている。51棟の倉庫はそれぞれウォルマート級。住民の反発で町議会7人のうち4人が辞任した。AI需要が地方自治を物理的に押しつぶしている。 元炭鉱の町に、51のウォルマートが降ってくる アーチボルド(Archbald)はペンシルベニア州北東部、ポコノ山脈のふもとにある人口7000人ほどの町だ。20世紀初頭に石炭産業が衰退してからは、森と住宅地が広がる静かなコミュニティになっていた。 その町に今、5社のデベロッパーが計6つのAIデータセンター群を建設しようとしている。51棟のデータ倉庫、1棟あたりウォルマート・スーパーセンター級、町の17平方マイルの土地のうちおよそ14% を占める規模。合計の延床面積は東京ドーム約18個分に達する。 「ウォルマートが51軒できる町」と言われて、それを歓迎する住民はまずいない。 住民は、開発の規模を見て言葉を失った そもそもデータセンターは、住宅街の隣に建つような建物ではない。屋根の下にずらりと並んだサーバーラックを24時間冷却し続ける必要があり、巨大な