中国が4万7000基の国産CPUで2EFlops超を主張
深圳の国家超級計算センターで、CPUのみで構成された巨大な国産スーパーコンピュータが姿を現した。名前は「灵晟(LineShine)」。海外チップへの依存ゼロを掲げる、中国の新しい看板だ。
深圳の国家超級計算センターで、CPUのみで構成された巨大な国産スーパーコンピュータが姿を現した。名前は「灵晟(LineShine)」。海外チップへの依存ゼロを掲げる、中国の新しい看板だ。
「灵晟」がついに点灯した
中国の国家超級計算深圳中心が4月27日、国産Eスケール超算システム「灵晟(LineShine)」を正式に発表した。深圳特区報の報道によれば、深圳市科技創新局の担当者は、灵晟が「全機テストを完了した」と述べている。完成すれば、中国が高性能計算で「全栈自主可控(フルスタックで自主管理可能)」という長年の宿願に最も近づいた瞬間になる。
少し冷めた目で見ると、ここには面白い現象がある。世界最速の座にあるAMDのEl Capitanは、最新2025年11月のTOP500ランキングでRmax(実測)1.809EFlops、Rpeak(理論ピーク)2.821EFlopsを記録し、CPUとGPUを統合したMI300A APUで構成される。つまりGPUの力で上に行っている。一方の灵晟は、GPUを使わない。CPUだけで2EFlopsを「持続」で出すという、まったく逆方向の選択をした。
「世界首台持続性能超2EFlops FP64の超級計算機」。これは灵晟のシステム総設計師であり深圳超算中心主任の卢宇彤氏が大会で行った主張だ。
灵晟は架構、性能、能耗、編程、扩展性、可靠性の六大技術突破を実現し、ソフトウェア・ハードウェア全栈で自主可控だ(卢宇彤氏)
この発言はそのまま受け取れない。FP64の 2EFlops持続性能 は、TOP500で使われるHPL-Linpackの実測Rmaxとは別物の指標であり、第三者検証が公開されない限り、灵晟が「世界一」かどうかは確認できない。深圳がTOP500への提出を予定しているのかも、現時点では発表がない。
4万7000基のCPU、92本のキャビネット、世界最大級の液冷
灵晟の構成は、規模だけ見れば確かに圧倒的だ。
wccftechがOGAWA Tadashi氏の情報をもとに伝えた仕様によれば、システムは2フェーズで構築される。パイロット検証システムは100台のKunpengサーバで1万2800コア。産業用本体は1580台のx86ブレードサーバで合計 10万1120コア にのぼり、理論ピークは10PFlops超に達する。サーバ構成は16台の4ウェイ機(合計2048コア)と8ウェイ機(合計1280コア)を含む。
システム全体としては、92本の計算キャビネット、4万7000基のCPU、36本のネットワークキャビネット、67本の液冷ストレージキャビネット、428ストレージノード、10TB/sの帯域幅、そして650PBのストレージ容量が計画されている。冷却用の二次配管は3214.7メートル、自重243.9トン。これだけの規模を一箇所に集約した液冷システムは、中国が主張する通りなら世界最大規模となる。
CPUのみで2EFlopsを目指す設計思想は、現代のスパコンで主流になっているCPU+GPU構成と真逆だ。GPUの計算密度を捨てる代わりに、相互接続と汎用計算の効率に賭ける選択である。
数字は確かに大きい。だが「持続性能2EFlops」を額面通りに受け取るには、FP64でその性能を出すワークロードの中身が問われる。HPL-Linpack、HPCG、特定の科学計算カーネル。どれを基準にしているかで意味が変わる。
「ゼロ・リライアンス」は本当にゼロなのか
灵晟が掲げる最大の旗印は、「対外依存ゼロ」だ。CPU、片上高带宽メモリ、高速相互接続、高吞吐ストレージ、三次元浮動正交、全液冷散熱。すべて国産で組んだとされる。
ここで立ち止まりたい。「国産」と「自主可控」は同じではない。
中国の主要な国産CPUは6社あるが、命令セットの自主性で見れば、完全に自前で作っているのは申威(SW-64命令セット)と龙芯(LoongArch)だけだ。残りの 鲲鹏と飞腾 はARM v8の永久ライセンスに依存し、海光と兆芯はx86のライセンスを米企業から得ている。鲲鹏は華為がARM v9の永久ライセンスを得られない可能性があり、長期的なリスクがある。
灵晟がどのCPUを使っているのか、卢宇彤氏は記者会見で具体名を挙げていない。ただ、wccftech経由の情報ではパイロット段階のサーバが「Kunpengサーバ」とされており、深圳超算中心は過去にも「鯤鵬応用創新大賽」で華為と協業している。実体としては、鲲鹏ベースの構成が中核を占める可能性が高い。
「ゼロ・リライアンス」という表現は強いが、命令セットの根は海外にある。この事実は、中国国内のCPU業界では公然と議論されてきた論点だ。
それでも、組み立てから冷却、ストレージ、ネットワーク、相互接続を国内で揃えた事実は無視できない。サンクションのリスクが現実化するなかで、外部供給に依存しない超大規模システムを実用レベルで動かせるかどうかは、技術的な達成度とは別の地政学的価値を持つ。
DeepSeekで578トークン/秒、9領域への展開
性能の主張のなかで、より具体的な数字も出ている。灵晟はDeepSeekでの per-CPUスループット を測定し、578トークン/秒に到達したという。システム全体ではこの100倍が見込まれている。
対応するAIモデルにはQwenなど中国国産モデルが含まれる。汎用HPCタスクとしては遥感(リモートセンシング)、材料科学、生信(バイオインフォマティクス)、気象、製薬、石油探査、生命科学、電磁シミュレーションの9領域が挙げられた。卢宇彤氏は自研の「片上多精度混合計算加速框架」と「面向領域的超智融合ソフトウェアプラットフォーム」が、科学計算・工学計算・智能計算の 「三算合一」 を統一サポートすると説明している。
この一覧は、超算が政治的なショーケースではなく、産業実用を前提に設計されていることを示している。9領域はそれぞれ大湾区(粤港澳大湾区)の重点産業と紐づき、深圳新闻网も「大湾区産業創新」「科創都市建設」を成果の文脈として強調した。
稼働時期と、検証されない「世界一」
ところで、灵晟はいつ本格稼働するのか。
中国の発表は「全機テストを完了し、点灯した」とまでで、商用運用の開始時期は明示していない。wccftechは2029〜2030年頃と推測しているが、これは元のソースには書かれておらず、編集者の見立てだ。「全機点灯」と「業務利用開始」の間にどれだけのチューニング期間が必要かは、過去のEスケール計画、たとえば天河三号、神威Eスケール原型機、曙光Eスケール原型機の経緯を見ても、数年単位のばらつきがある。
そして最大の問いは、灵晟がTOP500に提出されるかどうかだ。中国の超算は、2021年に深圳・無錫・済南・鄭州の4センターが米商務省のエンティティリストに掲載されて以降、TOP500への提出を控える傾向にある。米国によるサンクション再強化を懸念しての判断とされる。提出されなければ、灵晟が本当に「2EFlops持続FP64」を達成しているかどうかを、第三者ベンチマークで誰かが確認することはない。
自国基準での「世界一」と、国際ベンチマークでの「世界一」は、政治的にも技術的にも別物だ。
それでも灵晟が示したものは小さくない。CPUのみで2EFlopsを狙う アーキテクチャ選択、世界最大規模の液冷集約、9領域の産業実装。この組み合わせは、AMDとNVIDIAが牽引するGPU中心の超算とは違う方向の進化を提示している。中国の超算が独自の道を歩み始めた、その節目に位置するシステムだと言えるだろう。
灵晟が点灯した深圳の夜、世界の超算競争の地図は、また少し書き換わったのかもしれない。
参照元
他参照