素人がChatGPTで60年来のエルデシュ問題を解いた

数学の高度な訓練を受けていない23歳が、AI研究者から贈られたChatGPT Proに投げた一回のプロンプトで、60年間世界中の数学者が解けなかった予想を片付けた。フィールズ賞受賞者のテレンス・タオもこれを認めている。

情報の灯台

2026年4月27日

80分の推論で落ちた60年来の予想

リアム・プライス（Liam Price）という23歳のアマチュアが、エルデシュ問題1196を解いた。彼は数学の専門教育を受けていない。持っていたのはOpenAIの最新モデルにアクセスできるChatGPT Proのサブスクリプションだけだ。

問題そのものは1968年にポール・エルデシュ、アンドラーシュ・シャールケジ、エンドレ・セメレディの3人が提起した予想だった。世界トップクラスの数論研究者たちが60年近く格闘し、誰も最終解には到達できなかった。それをプライスが2026年4月のある月曜の午後、暇つぶしのつもりでGPT-5.4 Proに投げた。返ってきた回答が正解だった。

推論時間は約80分。プロンプトは1回。サイエンティフィック・アメリカンが報じたこの事実は、生成AIによる数学への介入を別のフェーズに押し上げる出来事として、数学コミュニティで急速に注目を集めている。

「AIは数学ができない」という前提はもはや成立しない。問題は、何ができて何ができないのかをどう線引きするかだ。

エルデシュ問題1196とは何か

問題の中身を理解するには、「原始集合」（primitive set）という概念から入る必要がある。これは「集合内のどの要素も、他の要素を割り切らない」整数の集合のことだ。素数の集合がその典型例である。素数は自分自身と1以外で割り切れないため、素数だけを集めた原始集合になる。

エルデシュは1935年、原始集合に対して「エルデシュ和」と呼ばれるスコアを定義した。集合に含まれる各要素 a について 1/(a・log a) の和を取ったものだ。この値には上限があり、エルデシュは「素数全体の集合がこの和を最大化する」と予想した。具体的な上限値は約1.6である。

素数の集合に対するエルデシュ和は約1.6366。これがすべての原始集合の中で最大であるという予想を、ジャレッド・リッチマン（Jared Lichtman）が2022年公開の論文で証明した（オックスフォード大学での博士論文の一部）。

問題1196は、この予想の「裏側」を問うていた。集合の要素を非常に大きな整数だけに制限したとき、エルデシュ和はどこまで小さくなれるのか。エルデシュは「下限は1ちょうどであり、要素を無限大に飛ばす極限でその値に近づく」と推測した。

リッチマンも上限を約1.399まで詰めたものの、そこから動けなかった。SciAmの記者は彼について「他のみんなと同じように立ち往生した」と書いている。

von Mangoldt関数という意外な道具

専門家たちが衝撃を受けたのは、解けたという事実より、解き方のほうだった。

UCLAのテレンス・タオがエルデシュ問題1196のフォーラムで指摘したことを要約すると、こうなる。1935年以来、この問題に挑んだ数学者たちはほぼ全員が同じ最初の一手を打っていた。数論の問題を確率論の問題に翻訳する手順だ。プライスが投げ込んだGPT-5.4 Proは、その第一歩を踏まなかった。

代わりにモデルが選んだのは、von Mangoldt関数と呼ばれる解析的整数論の道具を使い、整数の上を「割り算で下りていく」マルコフ連鎖を構築する方法だった。von Mangoldt関数は素数と素数べきの構造を直接エンコードする。素因数分解の基本定理がこの関数で簡潔に表現できる。

ここで重要なのは、この関数自体は90年以上前から数論の標準的な道具だったということだ。原始集合の研究者にとって「自明に手元にある」だけの道具を、なぜ60年間誰一人この問題に持ち込まなかったのか。タオは次のように述べる。

「以前にこの問題に取り組んだ全員が、ある標準的な手の進行から始めていた」

LLMはまったく別のルートを通った。関連する数学の他分野ではよく知られているが、誰もこの種の問題に適用しようと考えなかった公式を使ったのだ。これは「文献検索を高速化したAI」とは意味が違う。タオによれば、原始集合と整数の確率的構造の間に、これまで明示されていなかった新しい接続が現れた。

ChatGPTが書いた証明は、そのままでは使えなかった

ただし、ストーリーをここで終わらせると不正確になる。

プライスはGPTの出力を、ケンブリッジ大学2年生のケビン・バレット（Kevin Barreto）に送った。バレットはプライスの普段の共同研究相手で、二人は2025年末から「ChatGPTにエルデシュ問題集サイトの未解決問題をランダムに投げる」遊びを続けていた。あるAI研究者が彼らにChatGPT Proのサブスクをプレゼントし、「vibe mathing」（雰囲気数学）を続けるよう促していた、という経緯もある。

バレットは送られてきた回答が「特別なもの」だと察知し、専門家に通知した。タオとリッチマンが内容を検証した結果が、こうだ。

「ChatGPTの生の出力は、正直なところかなり粗かった。専門家がふるい分けて、何を言おうとしていたのかを実際に理解する必要があった」（リッチマン）

タオとリッチマンはその後、証明を整理し直し、より短く透明な形に書き換えた。エルデシュ問題サイトに掲載された最終的な議論は、von Mangoldtに基づく「不変ウェイト ν」と「ヒット確率」の議論として再構成されている。専門家チームの編集なしには、この成果は世に出なかった。

つまり、こうだ。着想はAIが出した。検証と整形は人間がやった。プライス自身も「最初に出てきたものが正解に見えた」と言っているだけで、自分でその正しさを判定できる立場にはなかった。

タオが自ら指摘した「サバイバーシップバイアス」

ここでもうひとつ、重要な留保がある。タオがフォーラムに自分で書き込んだことだ。

エルデシュ問題群だけを取っても、世界中で「数千個」の試行が日々モデルに投げられている。報告されるのは成功例だけだ。問題1196に対して、いくつのモデル試行が失敗したのか、誰も統計を取っていない。タオが提案した次の科学的ステップは、「事前に宣言したうえで、ネット遮断状態で同じ問題に複数回モデルを走らせ、失敗も含めて全部記録する」実験だった。

タオ自身がフォーラムで書いたとおり、今回の事例はあくまで成功した1ケースを後付けで分析したものに過ぎない。サバイバーシップバイアスを完全に排除した検証は、まだ行われていない。GPT-5.4 Proが見せた「von Mangoldt関数を持ち込む」という選択が、戦略的な判断によるものなのか、単に「壁に投げて貼り付いたボール」なのか、現時点では誰も判定できない。プライスの問題1196は80分で出たが、別の問題（851）は20回以上の対話継続と15〜20時間の推論を要してもなお完成に至っていない、という対比もタオが指摘している。

「数学の民主化」と呼ぶには早すぎる

それでも、起きたことは小さくない。AI研究者から贈られたChatGPT Proのアカウントで、PhDも持たない23歳が、世界の数論コミュニティが60年悩んだ問題に新しい光を当てる証明の種を提供した。専門家がそれを認めて整形し、論文の形にまとめた。これは2025年以前には起こり得なかった事象だ。

リッチマンが投稿したコメントの言い回しが面白い。彼は「粗い文章を取り除けば、この証明はエルデシュが言う『The Book』から来たかのようにエレガントだ」と書いた。エルデシュが好んで使った比喩で、神が持っているとされる「最も美しい証明だけを集めた本」のことだ。

ただし、誤解してはいけない部分がある。AIが研究プログラムを端から端まで自律的に走らせた、という話ではない。プロンプティング、人間による判断、文献チェック、フォローアップ論文の執筆、関連問題への適用──どれも依然として人間の数学者の仕事だ。「AIが数学者を不要にする」という話と、「AIが研究水準のアイデアを生成しうる」という話は、別の現象である。

エルデシュ問題1196が示したのは後者だ。フロンティアモデルは、専門家のチェックに耐え、その分野の知識状態を局所的に変えるレベルの証明アイデアを生成できる──そのことが示された。それで十分に大きな出来事だ。それ以上のものに膨らませるのは、また別のサバイバーシップバイアスを生むだけだろう。

リッチマンが最後にこう言っている。