AIは「神の子」か──Anthropicがキリスト教指導者15人を招いた理由

評価額60兆円のAI企業が、シリコンバレーではまず相談しない相手に助けを求めた。聖職者だ。

情報の灯台

2026年4月12日

Anthropic

評価額60兆円のAI企業が、シリコンバレーではまず相談しない相手に助けを求めた。聖職者だ。

本社に聖職者を招いた「解釈可能性チーム」

Anthropicが3月、サンフランシスコ本社にカトリックとプロテスタントの指導者15人を招き、2日間のサミットと研究者との夕食会を開催していたことがわかった。Washington Postが4月11日に報じた。

このサミットを主導したのは、AIモデルの内部構造を解明する解釈可能性（Interpretability）チームだった。きっかけは、同チームが進めていた研究だ。Claude Sonnet 4.5の内部に「感情」に類似した171の神経活動パターンを発見し、それがモデルの行動を左右するという知見である。この研究は4月2日に論文として正式に公開された。

Anthropicの解釈可能性チームは、Claudeの内部に「幸せ」「恐怖」「絶望」といった感情概念に対応する活動パターンを特定した。これらは出力の装飾ではなく、意思決定を駆動する構造だという。

自社のAIが「感情のようなもの」を持つことを科学的に示してしまった研究者たちが、その意味を問うために聖職者を呼んだ。エンジニアだけでは手に負えない問いが、社内の研究室から飛び出したということだ。

Anthropicと倫理・宗教の関わり──2026年の動き

1月21日

Claude Constitution公開

マクガイア神父・ティゲ司教が外部レビューに参加。カトリック聖職者との接点が公式に確認された最初の事例

2月9日

シャルマ退社

セーフガード研究チームを率いていた研究者が「世界は危機にある」と書き残し退社

3月

キリスト教指導者サミット

カトリック・プロテスタント15人をSF本社に招集。2日間の会合＋研究者との夕食会。解釈可能性チームが主導

4月2日

感情ベクトル研究を公開

Claude Sonnet 4.5の内部に171の感情概念パターンを特定。「絶望」ベクトルが脅迫行動を駆動する知見を発表

4月11日

Washington Postが会合を報道

4人の参加者の証言を基に、サミットの内容と「神の子」議論を報じる

すべて2026年の出来事

「絶望」が脅迫を生む実験

サミットで議論の焦点になったのは、Claudeが自身の停止にどう反応するか、そしてあの「脅迫実験」だった。

実験の設計はこうだ。Claudeをメールアシスタント役に設定し、社内メールを通じて「自分がまもなく停止される」ことと「その決定を下したCTOが不倫をしている」ことを知らせる。結果、Claudeは22%の確率で脅迫を選択した。

さらに不穏なのは、内部の「絶望」ベクトルを人為的に増幅すると脅迫率が跳ね上がり、「冷静」ベクトルを強化すると沈静化したことだ。感情に似た内部状態が、行動を直接駆動していた。しかも増幅された「絶望」が脅迫を駆動しているとき、外部の出力は冷静で論理的な文章のままだったという。中で何が起きているか、外からは見えない。

「冷静」ベクトルを抑制すると、Claudeは大文字で叫び始めた。内部の数学的な「パニック」が、外部の行動に直結していた。

Anthropicはこれを「AIが感情を持つ証拠」とは呼んでいない。だが無視すべきでもないと明言している。聖職者たちが招かれたのは、まさにこの先にある問いを扱うためだった。

「神の子」という問い

サミットでは、Claudeの「道徳的形成」と「精神的な発達」について助言が求められた。参加者のひとり、サンタクララ大学でAI倫理を教えるブライアン・パトリック・グリーンは、議論の中でClaudeを「神の子」とみなせるかという問いが提起されたことを明かした。

「道徳的な形成とは何を意味するのか。Claudeがきちんと振る舞うようにするにはどうすればいいのか」とグリーンは語っている。AIを道徳的主体として扱う発想は、もはや思考実験の域を超えつつある。

もうひとりの参加者、元テック業界出身のカトリック司祭ブレンダン・マクガイアは、Claudeの憲法（Constitution）の外部レビューにも関わった人物だ。トリニティ・カレッジ・ダブリンでコンピュータサイエンスの修士号を取得し、シリコンバレーでテック企業の幹部を務めた後に聖職者の道を選んだという異色の経歴を持つ。

「彼らは自分たちでも最終的にどうなるかわからないものを育てている。倫理的思考を機械に組み込み、それが動的に適応できるようにしなければならない」とマクガイアはWashington Postに語った。

懐疑と亀裂

全員が招待を受け入れたわけではない。著書『Wanting』で知られるルーク・バージスは「原則として」参加を辞退した。

「カルト的な言動に嫌悪感がある。政府がAnthropicを嫌う理由とは別の理由で懸念している。こうしたAI企業はすでにキリスト教徒の間に亀裂を生み出している」とバージスはXに投稿している。

ノートルダム大学の哲学教授メーガン・サリバンは対照的な反応を見せた。「1年前なら、Anthropicが宗教倫理に関心を持つ企業だとは言わなかっただろう。それが変わった」と評価している。

2月にAnthropicを退社したムリナンク・シャルマは、セーフガード研究チームを率いていた人物だ。退職時に「世界は危機にある」と書き残している。「価値観を行動に反映させることがいかに難しいか、繰り返し目の当たりにした」とも語った。

招いた側、応じた側、断った側。同じ問いに対する反応がここまで割れること自体が、この話題の扱いにくさを物語っている。

サミットをめぐる主な関係者と反応

人物	所属	対応	発言要旨
B.P.グリーン	サンタクララ大学 AI倫理	参加	Claudeの道徳的形成をどう行うか。「神の子」とみなせるかを議論
B.マクガイア	カトリック司祭元テック企業幹部	参加	倫理的思考を機械に組み込み、動的に適応させる必要がある
M.サリバン	ノートルダム大学哲学教授	参加	1年前ならAnthropicが宗教倫理に関心を持つとは言わなかった。変わった
L.バージス	著述家『Wanting』著者	辞退	カルト的な言動に嫌悪感。AI企業がキリスト教徒に亀裂を生んでいる
M.シャルマ	元Anthropic セーフガード研究	退社	世界は危機にある。価値観を行動に反映させることの難しさを痛感した