Azureの「構造的脆弱性」を元エンジニアが告発、人材軽視の代償
Microsoftのクラウド基盤Azureが、創設期からの構造的な問題を抱えたまま巨大化している。9年間その中枢にいた元エンジニアが、6本の連載で内幕を書き始めた。
Microsoftのクラウド基盤Azureが、創設期からの構造的な問題を抱えたまま巨大化している。9年間その中枢にいた元エンジニアが、6本の連載で内幕を書き始めた。
9年間在籍した男が見た「現実」
アクセル・リートシンは、Windowsのベースカーネルエンジニアとして8年、Azure Core Computeのエンジニアとして1年、合計9年間Microsoftの中枢にいた。Substackで「How Microsoft Vaporized a Trillion Dollars」(Microsoftはいかにして1兆ドルを蒸発させたか)と題した連載を公開している。
2026年3月29日から始まったシリーズは、すでに6本を数える。リートシンはAzure Boostオフロードカードの開発チームに所属し、Windowsコンテナプラットフォームの発明にも関わった人物で、DockerやAzure Kubernetesの基盤技術に関する特許も保有している。
「Azureは約束されたほどスムーズにも自律的にも稼働したことがなかった。Microsoftが世界に、そして最も要求の厳しい顧客に提示していたものは、常に生命維持装置につながれた精巧なシステムだった」
173のエージェント、誰も説明できない
リートシンが2023年5月にAzure Coreに着任した初日のエピソードが象徴的だ。月例計画会議で、チームはAzure Boost用の小型ARMチップにWindowsの機能群を移植する計画を真剣に議論していた。指の爪ほどのサイズのSoCに、Windowsの半分を載せようとしていたのだ。
さらに調査を進めると、Azureの各ノードを管理するために173個のエージェントが候補として特定されていたことが判明した。リートシンによれば、Microsoft社内で、なぜ173個も必要なのか、それぞれが何をしているのか、どう相互作用するのかを説明できる人間は「一人もいなかった」という。
Azureが売っているのは突き詰めればVM、ネットワーク、ストレージだ。監視とメンテナンスを加えても、173個のエージェントが必要になる理由を合理的に説明するのは難しい。誰も全体像を把握していないシステムが、米国政府のクラウドやOpenAIのAPIを動かしている。そこが問題の本質だ。
テスター廃止が生んだ連鎖
問題の根は2014年に遡る。サティア・ナデラがCEOに就任して間もなく、専任のテスター職(SDET)が廃止された。大規模なレイオフが実施され、残ったテスターの多くは開発職に再配置されたが、一部はAzureの運用チーム(OPEX)に流れた。
システム設計の経験が限られた元テスターたちが、ミッションクリティカルなクラウドインフラの運用を担うことになった。彼らの献身的な働きは認めつつも、アーキテクチャの深い理解が求められる領域に構造的なギャップが生じた。
24時間体制のオンコールローテーション、インシデント対応、事後分析。OPEXチームの仕事は過酷で、離職率は高い。知識が蓄積される前に人が去り、新しい人が来てまた同じ問題に直面する。リートシンはこのサイクルを「知識の希薄化」と呼んでいる。
「人に触らせない」はずだったクラウド
Azureの原型「Red Dog」を率いたのは、VMS(Virtual Memory System)とWindows NTの設計で知られるデイブ・カトラーだった。カトラーのビジョンは明確で、人間が手動でノードに触ることは厳禁。すべてを自動化し、人的介入ゼロで運用するクラウドだった。
現実はそのビジョンから大きく逸脱した。ProPublicaの調査報道が明らかにしたのは、時給18ドル(約2,900円)の契約スタッフが、中国を含む海外のMicrosoftサポート担当者の指示でコマンドをコピー&ペーストし、政府向けクラウドのノードを手動で操作する「デジタルエスコートセッション」の実態だった。政府向けクラウドだけで毎月「数百件」のこうした介入が行われていたという。
ピート・ヘグセス国防長官が公にMicrosoftとの「信頼の破壊」に言及した背景には、この構造がある。
OpenAIの「不信任投票」
2025年3月、OpenAIはCoreWeaveとの間で119億ドル(約1兆9,000億円)のコンピュート契約を締結した。Microsoftとの優先交渉権を持ちながら、あえて別のインフラ事業者を選んだこの判断を、リートシンは事実上の不信任投票と見ている。
「MicrosoftがOpenAIの厳しい要件を、期限内に、必要な規模で満たすのに苦労していたと合理的に推測できる」とリートシンは書いている。
そしてその数か月後、Microsoftは2025年5月から7月にかけて約1万5,000人を解雇した。AI投資に年間800億ドルを注ぎ込みながら、人を切る。この構図からは矛盾しか見えない。
GitHubの稼働率90%割れという現実
人を減らしてAIに置き換える戦略のツケは、Microsoftの足元でも可視化されている。GitHub の稼働率が2025年のある時点で90%を下回ったことが、非公式のステータスデータから判明している。SLAで約束された99.9%とは桁違いの乖離だ。
GitHub CTOのヴラド・フョードロフは2026年3月のブログで、Azureへの移行を解決策として掲げた。現在、GitHubトラフィックの12.5%がAzure Central USリージョンから配信されており、7月までに50%を目指すとしている。
しかしHacker Newsをはじめとするオンラインコミュニティでは、Azure自体が不安定さの原因ではないかという推測が飛び交っている。あるユーザーは「GitHubが障害を起こすたびに、うちのAzure環境も問題を抱えている。もはや社内ミームだ」と書いている。
リートシン自身は慎重だ。「GitHubのサーバーがAzureに移行中または移行済みであることは公式発表から分かる。だから可能性はあるが、移行が完了したかどうかは不明だ」と述べるにとどめている。
AIが加速する「人の不足」
catchmetrics.ioの共同創業者マーティン・アルダーソンは、この状況を「来たるコンピュート・クランチ」と表現している。AIコーディングエージェントが大量のコードを生成し、そのテストとデプロイにさらなるコンピュートが必要になり、デプロイされたコードの運用にもサーバーが必要になる。需要が需要を生む構造だ。
AnthropicのAIエージェント「Claude Code」の公開コミット数は過去3か月で4倍に増加した。非公開のものを含めれば、その数はさらに多いとアルダーソンは見ている。
構図はこうだ。
人を減らしてAIに投資する。AIが大量のコードを生み出す。そのコードを検証し、インフラを維持する人がさらに必要になる。しかし人はすでに減らされている。このループが、Microsoftだけでなくテック業界全体を蝕みつつある。
リートシンはAIによるソフトウェアエンジニアの代替について懐疑的だ。「LLMはパターンの再現に優れている。訓練セットで何度も見たソフトウェアの変種を作る場合には役立つ。バグの発見も、学習済みパターンからの逸脱を確率的に検知しているだけだ。大いにセンセーショナリズムがあり、AIがソフトウェアエンジニアに取って代わるという話には楽観していない」
CEOにも取締役会にも届かなかった警告
リートシンの連載で最も重い部分は、おそらく最後だ。彼はAzureノードスタックの問題点と組織的課題をまとめ、Cloud+AI担当EVP、CEO、さらには取締役会に書簡を送った。国家安全保障へのリスクを冒頭に据え、第一原理からの再構築を提案したという。
返答は、一通もなかった。確認の連絡も、質問も、受領通知すらなかったとリートシンは書いている。
The Registerの取材に対し、Microsoftは記事公開時点でコメントを寄せていない。
技術的に正しいことを言った人間が追い出され、警告は無視され、問題は膨らみ続ける。Microsoftに限った話ではない。どの技術組織でも、「効率化」の名のもとに人を切り始めた瞬間から、同じ崩壊が始まる。
リートシンの提言はシンプルだった。「長期在籍のシニアエンジニアによるメンタリングとコーチングを通じて、人に投資すること。最大の課題は、高い離職率が引き起こした知識の希薄化だった」
人を切って浮いた金でAIを買い、AIが生み出す問題に対処する人がいない。この馬鹿げたループを止められるのは、コードを書くAIではなく、コードの意味を理解している人間だけだ。
| カトラーのビジョン | 2025年の現実 | |
|---|---|---|
| 運用方針 | 人的介入ゼロの自律運用 | 政府クラウドだけで月「数百件」の手動介入 |
| 介入者 | ノードへの手動アクセス厳禁 | 時給18ドルの契約スタッフがコマンドをコピペ |
| 人材戦略 | 少数精鋭のカーネルエンジニア | 1万5,000人解雇+年800億ドルのAI投資 |
| 顧客信頼 | 品質が完全になるまで慎重に公開 | OpenAIがCoreWeaveへ119億ドル契約で離脱 |
| 稼働率 | SLA 99.9%の約束 | GitHub稼働率が90%を下回る時期あり |
| 内部対応 | 問題の根本原因を追究して修正 | エンジニアの警告書簡に一通も返答なし |
参照元
他参照
関連記事
- AWS中東リージョン「完全ダウン」──Amazon社内文書で判明
- Oracle「午前6時のメール」で最大3万人を一斉解雇
- マスク、OpenAI訴訟を修正──「1ドルも自分の懐には入れない」宣言の裏側
- AI検索でブランドを売り込む新SEO産業、ゴールドラッシュの内幕
- Copilotが80種類、Microsoftの命名が迷走中
- OpenAIのCEOとCFOがIPO時期で対立、経営の亀裂が表面化
- Microsoft日本に100億ドル──巨額AI投資の裏側
- マイクロソフト、自社AIモデル3種でOpenAI依存脱却へ
- 英国CMA、Microsoftの業務ソフト帝国にメスを入れる
- GitHub Copilot、PR広告を即日撤回──残る150万件の不信