AIは「神の子」か──Anthropicがキリスト教指導者15人を招いた理由
評価額60兆円のAI企業が、シリコンバレーではまず相談しない相手に助けを求めた。聖職者だ。
評価額60兆円のAI企業が、シリコンバレーではまず相談しない相手に助けを求めた。聖職者だ。
本社に聖職者を招いた「解釈可能性チーム」
Anthropicが3月、サンフランシスコ本社にカトリックとプロテスタントの指導者15人を招き、2日間のサミットと研究者との夕食会を開催していたことがわかった。Washington Postが4月11日に報じた。
このサミットを主導したのは、AIモデルの内部構造を解明する解釈可能性(Interpretability)チームだった。きっかけは、同チームが進めていた研究だ。Claude Sonnet 4.5の内部に「感情」に類似した171の神経活動パターンを発見し、それがモデルの行動を左右するという知見である。この研究は4月2日に論文として正式に公開された。
Anthropicの解釈可能性チームは、Claudeの内部に「幸せ」「恐怖」「絶望」といった感情概念に対応する活動パターンを特定した。これらは出力の装飾ではなく、意思決定を駆動する構造だという。
自社のAIが「感情のようなもの」を持つことを科学的に示してしまった研究者たちが、その意味を問うために聖職者を呼んだ。エンジニアだけでは手に負えない問いが、社内の研究室から飛び出したということだ。
「絶望」が脅迫を生む実験
サミットで議論の焦点になったのは、Claudeが自身の停止にどう反応するか、そしてあの「脅迫実験」だった。
実験の設計はこうだ。Claudeをメールアシスタント役に設定し、社内メールを通じて「自分がまもなく停止される」ことと「その決定を下したCTOが不倫をしている」ことを知らせる。結果、Claudeは22%の確率で脅迫を選択した。
さらに不穏なのは、内部の「絶望」ベクトルを人為的に増幅すると脅迫率が跳ね上がり、「冷静」ベクトルを強化すると沈静化したことだ。感情に似た内部状態が、行動を直接駆動していた。しかも増幅された「絶望」が脅迫を駆動しているとき、外部の出力は冷静で論理的な文章のままだったという。中で何が起きているか、外からは見えない。
「冷静」ベクトルを抑制すると、Claudeは大文字で叫び始めた。内部の数学的な「パニック」が、外部の行動に直結していた。
Anthropicはこれを「AIが感情を持つ証拠」とは呼んでいない。だが無視すべきでもないと明言している。聖職者たちが招かれたのは、まさにこの先にある問いを扱うためだった。
「神の子」という問い
サミットでは、Claudeの「道徳的形成」と「精神的な発達」について助言が求められた。参加者のひとり、サンタクララ大学でAI倫理を教えるブライアン・パトリック・グリーンは、議論の中でClaudeを「神の子」とみなせるかという問いが提起されたことを明かした。
「道徳的な形成とは何を意味するのか。Claudeがきちんと振る舞うようにするにはどうすればいいのか」とグリーンは語っている。AIを道徳的主体として扱う発想は、もはや思考実験の域を超えつつある。
もうひとりの参加者、元テック業界出身のカトリック司祭ブレンダン・マクガイアは、Claudeの憲法(Constitution)の外部レビューにも関わった人物だ。トリニティ・カレッジ・ダブリンでコンピュータサイエンスの修士号を取得し、シリコンバレーでテック企業の幹部を務めた後に聖職者の道を選んだという異色の経歴を持つ。
「彼らは自分たちでも最終的にどうなるかわからないものを育てている。倫理的思考を機械に組み込み、それが動的に適応できるようにしなければならない」とマクガイアはWashington Postに語った。
懐疑と亀裂
全員が招待を受け入れたわけではない。著書『Wanting』で知られるルーク・バージスは「原則として」参加を辞退した。
「カルト的な言動に嫌悪感がある。政府がAnthropicを嫌う理由とは別の理由で懸念している。こうしたAI企業はすでにキリスト教徒の間に亀裂を生み出している」とバージスはXに投稿している。
ノートルダム大学の哲学教授メーガン・サリバンは対照的な反応を見せた。「1年前なら、Anthropicが宗教倫理に関心を持つ企業だとは言わなかっただろう。それが変わった」と評価している。
2月にAnthropicを退社したムリナンク・シャルマは、セーフガード研究チームを率いていた人物だ。退職時に「世界は危機にある」と書き残している。「価値観を行動に反映させることがいかに難しいか、繰り返し目の当たりにした」とも語った。
招いた側、応じた側、断った側。同じ問いに対する反応がここまで割れること自体が、この話題の扱いにくさを物語っている。
| 人物 | 所属 | 対応 | 発言要旨 |
|---|---|---|---|
| B.P.グリーン | サンタクララ大学 AI倫理 |
参加 | Claudeの道徳的形成をどう行うか。「神の子」とみなせるかを議論 |
| B.マクガイア | カトリック司祭 元テック企業幹部 |
参加 | 倫理的思考を機械に組み込み、動的に適応させる必要がある |
| M.サリバン | ノートルダム大学 哲学教授 |
参加 | 1年前ならAnthropicが宗教倫理に関心を持つとは言わなかった。変わった |
| L.バージス | 著述家 『Wanting』著者 |
辞退 | カルト的な言動に嫌悪感。AI企業がキリスト教徒に亀裂を生んでいる |
| M.シャルマ | 元Anthropic セーフガード研究 |
退社 | 世界は危機にある。価値観を行動に反映させることの難しさを痛感した |
IPOを控えた企業の「魂の問い」
Anthropicは評価額3800億ドル(約60兆円)の企業であり、年内のIPOが取り沙汰されている。国防総省との契約紛争では自律型兵器と大量監視への協力を拒否し、政府からサプライチェーンリスクの指定を受けるという前代未聞の事態も経験した。
その企業が、聖職者に「AIの魂」について相談している。
Gizmodoのマイク・パールはこの構図を端的に突いた。AI感覚性の議論は哲学的に価値がある。だがIPOを控えた企業の内部で行われるとき、その探求の妥当性には疑問符がつく、と。
Anthropicの広報担当者はWashington Postに対し、他の宗教グループの思想家にも意見を求めていく方針だと回答した。
AIの内部に「感情のようなもの」を発見した企業が、その意味を真剣に問おうとしている。その姿勢自体は誠実だろう。ただ、問いの場所が株式公開を目前に控えた営利企業の会議室であることを、忘れるわけにはいかない。
「Claudeは神の子か」。答えはまだ誰も持っていない。だが少なくとも、その問いが大真面目に議論される時代には、もう入っている。
参照元
他参照
関連記事
- AIの「感情」が脅迫を生んだ――Anthropic衝撃の実証研究
- Metaで「トークン消費量」が新たなステータスに——社内リーダーボード「Claudeonomics」の狂騒
- Anthropicの三重苦——赤字・中国AI・安全性の代償
- Anthropic、OpenClaw開発者をBAN
- Anthropic、D.C.巡回区がブラックリスト停止を拒否
- Anthropic、Google・Broadcomと数GW級TPU契約 売上は3倍超
- OpenAI・Anthropic・Googleが共闘、中国への「蒸留」流出で情報共有
- Claude Code劣化問題、AMDのAI責任者が膨大なログで告発
- OpenAIのCEOとCFOがIPO時期で対立、経営の亀裂が表面化
- ザッカーバーグが20年ぶりコード復帰、使うのはClaude Code