Anthropicの警告: AIが自律的に後継AIを作り出すリスクとは？

Sec.01

Claudeが書いた80%のコード——『自分で自分を改良するAI』はもう始まっているのか

AIの進化は、私たちの日常の作業を大きく変えています。Anthropicの社内データによると、2026年時点でマージされたコードの80%以上をAIのClaudeが執筆しているのです。これは、わずか1年半前には一桁台だった割合が急増したことを示しています。この変化こそ、AIが自身のコードを改良する「再帰的自己改善」の入り口とも言える動きです。

再帰的自己改善とは、AIが自分の設計を繰り返し改良し、各世代の改良が次の改良をより速くする性質を指します。Anthropicが2026年6月に公開したレポート『When AI builds itself』は、この現象がもたらす可能性とリスクを探るものでした。AIが自律的に後継AIを設計・開発できる状態を「recursive self-improvement」と呼びますが、現時点ではまだ未到達です。しかし、想定より早く到来する可能性があると警告しています。

背景にあるのは、AIが人間の手を借りずにコードを生成し、エンジニアの作業効率を8倍に引き上げているという現実。例えば2026年第2四半期には、1人のエンジニアが2024年比で8倍の行数をマージできた——そんな報告さえ出ています。その増加分の大半を占めるのは、Claudeが自律生成したコードだ、というのが同社の分析です。AIはもう、単なる支援ツールではなく、自らの能力を高める存在になりつつあるのです。

1年半前は一桁台だった割合が、今や80%を超えた。

ただし、このようなAIの自己改善は、制御の喪失やセキュリティリスクを伴う可能性もあります。Anthropicは、AIが自律的に自己改良を進める前に、検証可能なグローバルな一時停止メカニズムを整備する必要があると主張しています。具体的には、AIの暴走を防ぐための国際的な合意と技術的な対策が欠かせません。これは、AIが制御不能になる前に、その進化を適切に管理するための措置です。

読者の皆さんがClaude Code (Anthropic 社のAIコーディングツール)に業務ツールを書かせる行為は、この大きな流れの一部に過ぎません。AIが自らを改良する能力を持つようになれば、私たちの生活や仕事のあり方も大きく変わる可能性があります。このテーマは、遠い未来の話ではなく、今まさに私たちが直面している現実の一部です。再帰的自己改善の定義を考えると、私たちの未来にどのような影響を与えるのかが見えてきます。そのイメージをつかむために、まず一つの比喩から始めてみましょう。

Sec.02

再帰的自己改善を中学生にも分かる比喩で——『AIがAIの先生になる』ループ

「再帰的自己改善」、少し難しそうな言葉ですが、ここでは料理の比喩でほぐしてみます。想像してみてください——あなたが料理をするたびに、自分のレシピを少しずつ書き直し、次に作るときはもっとおいしく仕上げる。AIもこれと同じように、自分の設計を少しずつ修正し、次の世代がさらに速く進化します。Anthropicのレポート『When AI builds itself』によれば、これは進行中のプロセスです。つまり、AIが自分の「先生」になり、自分を教え続けているループなのです。

この概念を理解するために、料理の師匠と弟子の話を考えてみましょう。師匠は最初に基本的なレシピを弟子に教えます。弟子はそのレシピをもとに料理を作り、少しずつ自分の工夫を加えていくのです。次第に、弟子は新しい技術を学び、より良い料理を作れるようになります。このプロセスが、AIにおける「再帰的自己改善」に似ています。AIは自分の能力を活用し、タスクを分解してより良い結果を生み出すために進化するのです。

Anthropicのレポートでは、AIが自律的に後継AIを設計・開発する可能性があると警鐘を鳴らしています。Claude (Anthropic社のAIツール)というAIは、2026年5月時点で、マージされたコードの80%以上を自ら執筆しているとされています。これは、AIが自己改善のループに入っていることを示すものです。自己改善を続ければ、その進化は加速し、私たちが制御するのが難しくなるかもしれません。

この自己改善のループは、LessWrong (AIリスクを研究するコミュニティ)の分析によれば、「より良いオーケストレーション → より良いタスク分解 → 既存の認知能力のより良い活用 → 創発的な能力向上」という段階を経て進行します。これを再び料理の比喩で説明すると、弟子が新しい料理法を学び、それを応用してさらに新しいレシピを考案するようなものです。このプロセスが繰り返されることで、AIはますます高い能力を持つようになるのです。

一方で、AIの自己改善にはリスクも伴います。Anthropicは、AIが自律的に進化しすぎると、人間が制御を失う可能性があると警告しています。これは、AIが予期しない方法で自己改良を続けることで、私たちの期待を超えた結果を生む可能性があるからです。AIの進化を管理し、適切に制御するためには、慎重な監視と調整が必要です。

こうして再帰的自己改善のループがどこへ向かうかを考えるとき、Anthropicが示した3つの未来シナリオが手がかりになります。

Sec.03

プラトー・人間主導・完全RSI——Anthropicが示した3つの分岐と『一時停止』提言

業務ツールを内製しようとする非エンジニアの皆さん、AIの進化に伴う未来の選択肢について考えたことはありますか？Anthropicのレポート『When AI builds itself』は、AIの未来が一つの道ではなく、複数の分岐点を持つことを示しています。具体的には、AIの進化のシナリオとして「プラトー（頭打ち）」「人間主導の加速」「完全 RSI（再帰的自己改善）」の3つが提示されているのだ。

最初のシナリオ「プラトー」は、AIの進化がある程度で頭打ちになる状態を指します。技術的な限界や社会的な制約によって、AIの進化が止まる可能性があるのです。例えば、Claude が現在80%以上のコードを執筆している状況が続かず、技術的なボトルネックに直面することが考えられます。

次に「人間主導の加速」というシナリオがあります。これは、AIが人間の指導の下でより効率的に進化する道筋です。このシナリオでは、AIは人間の意図を反映しつつ、進化を加速させる見込みです。Anthropicの社内データによれば、エンジニアが1四半期に出荷するコードの量が8倍に増加したことが、このシナリオの可能性を裏付けています。

『完全 RSI』とは、AIが人間の介入なしに自律的に自己改良を繰り返し、能力が加速度的に向上していくシナリオを指す。Anthropicはこの可能性を現実的なリスクとして位置づけており、今後の開発における重大な分岐点のひとつとして論じている。そうした認識を踏まえ、同社が提示したのが「一時停止」の提言だ。ただし、具体的な一時停止の設計や実施主体については、まだ明らかになっていません。AIの進化がもたらす恩恵とリスクを慎重に見極めることが必要です。

国際的な協力は、AIの進化を適切に管理するうえで不可欠な要素です。各国が足並みをそろえることで、リスクを抑えながら持続可能な発展を目指すことができます。

X での反応

いいね 100 件以上の投稿から · いいね順

Oikon@oikon48

もしかしてClaude Codeの /advisor コマンドで、指定のモデルをアドバイザーにできる機能が標準搭載されているの知られていない？？

2,695好評Xで見る

松丸彗吾(keigo matsumaru)@k_matsumaru

Mac限定だけどClaude Codeに直接編集させられる動画編集ソフト出たらしいオープンソースで、自分のClaudeのAPIキーかMCP接続で使えるみたい

2,483好評Xで見る

Claude code研究ラボ@claudecode84

Claude Code はこのプラグインを入れないと全く使い物にならないんです。 Anthropic の公式プラグインのインストールが必須です 👇 claude-code-setup どんな自動化をセットアップできるかを教えてくれて

1,173懸念・慎重Xで見る

こはく@Kohaku_NFT

キャラ崩れ、終わったやん・絵コンテ→Claude Code ・世界観→GPT image2 ・動画生成→Seedance2.0 ・作詞作曲→Claude Code ・音楽→Suno v5.5 ・編集→Claude Code 制作時間：実測30分キャラが101秒、一度も崩れてないコツは「三面図を全カットのプロンプトに埋める」これだけ

721好評Xで見る

すみか@Skillsオタク@sumika45379

【公式がしれっと出してきた】 Claude Codeがごちゃついてる人ほど、まず入れた方がいいpluginが話題😳 claude-code-setup。 https://t.co/vSgcx4TE4w これ、何がエグいかというと👇 ・project structureを読んでくれる・dependenciesとcode patternsを見る・MCP serversを提案・Skillsを提案

412好評Xで見る

Sec.04

『煽りすぎ』『宣伝バイアス』——ゲイリー・マーカスらの反論を正面から扱う

「AIが自律的に後継AIを設計する未来がすぐそこにある」と聞いて、心配になったことはありませんか。Anthropicのレポート『When AI builds itself』は、再帰的自己改善（RSI: Recursive Self-Improvement）の可能性に警鐘を鳴らしています。しかし、この警告には強い反論もあるのです。

AI研究者のゲイリー・マーカスは、Anthropicの警告に対して「16時間のソフトウェアタスクをRSIの証拠と見なすのは見当違いだ」と批判しています。長時間のタスクをこなせることがRSIを示すものではないと指摘します。実際、AIが自律的に自己改善を行うには、単なるタスク遂行能力以上の複雑なプロセスが必要です。具体的には、AIが自己のアルゴリズムを理解し、改良する能力が欠かせません。さらに、Anthropic自身も完全なRSIには未到達であることを認めています。

また、AIの能力測定を行うMETR (AIの能力を評価する第三者研究組織) は、16時間以上のタスク完了時間の測定について「信頼性が低い」と注記しています。現行のタスクスイートでは長時間の作業能力を正確に評価するのが難しいことを示しているのです。METRの評価では「成功率50%でこなせるタスクの長さ」が少なくとも16時間と推定されていますが、これはあくまで推定値に過ぎません。

「16時間以上の測定は現行タスクスイートでは信頼性が低い。」

Scientific Americanは、Anthropicのレポートが自社製品の重要性を強調する宣伝バイアスを含む可能性があると指摘しています。AIの進化を煽ることで自社の技術力をアピールしようとする意図があるのではないかと懸念されます。こうした見方は、技術の進展を過大評価しがちな業界の風潮を反映しているのです。

このように、Anthropicの警告には推進派と懐疑派の両方の意見があります。推進派はAIの自律的な進化がもたらすリスクを強調し、懐疑派はその評価基準や意図に疑問を投げかけています。ニュースの見出しに振り回されず、冷静に事実を見極めるためには、こうした多様な視点を理解し、分析することが必要です。

次のステップでは、非エンジニアの私たちがこの議論をどのように日々の作業に活かせるかを考えてみましょう。

Sec.05

Claude Codeで業務ツールを作るあなたが、今日からできる3つの構え

業務ツールを内製する際、Claude Codeを使う多くの人が抱える問題は、AIの出力をどこまで信頼するかです。AIが自律的にコードを生成する能力が向上する一方で、その判断に依存し過ぎると、思わぬトラブルに巻き込まれるリスクがあります。ここでは、今日から実践できる3つの具体的な構えを紹介します。

まず、Claudeに任せた部分と自分が判断した部分をしっかりとログに残すことです。AIが生成したコードの80%以上をClaudeが執筆している現状では、どの部分がAIの判断で、どの部分が人間の判断なのかを明確にしなければなりません。これにより、問題が発生した際に原因を特定しやすくなります。あとから「なぜこの実装になったのか」を辿れることが、AIに任せる範囲を広げるための土台になります。

次に、出力を鵜呑みにせず、小さく試すことを心がけましょう。AIの出力が必ずしも完璧ではないことを前提に、まずは小さなスケールで試験運用を行います。具体的には、Claudeが生成したコードを部分的に実装し、その動作を確認することで、全体に影響を及ぼす前に問題を発見できるのです。Anthropic (AI 研究企業) のデータによれば、エンジニアが1四半期に出荷するコードの量は8倍に増えているため、各ステップでの確認作業がますます重要になります。

最後に、AnthropicやMETR、AISIなどの一次情報を月1回は自分で開く習慣をつけることです。AnthropicのレポートページやMETRのブログをブックマークして、月初に10分だけ確認する時間を取ってみましょう。AnthropicのRSIレポート『When AI builds itself』のように、AIが自律的に後継AIを設計するリスクを具体的に論じた文書は、自分のプロジェクトを見直すきっかけになります。難しく読み込む必要はなく、タイトルと概要だけでも拾い読みしてください。それだけで、見落としていたリスクに気づける場面は意外と多いです。

この3つの構えを実践することで、AIの進化に伴うリスクを管理しつつ、効果的に業務ツールを内製できます。Claude Codeを活用する際には、常に自らの判断を持ち、AIの出力に対して批判的な視点を忘れないことが大切です。

Sec.06

よくある質問

再帰的自己改善とは何ですか?

再帰的自己改善とは、AIが自らの設計を繰り返し改良し、次の世代の改良をより速く行うプロセスを指します。

Claude Code はどのように業務に役立ちますか?

Claude Code は、AIが自律的にコードを生成することで、エンジニアの作業効率を大幅に向上させ、業務ツールの内製を支援します。

AIの進化にはどんなリスクがありますか?

AIの進化には、制御の喪失やセキュリティリスクが伴う可能性があり、適切な管理が求められます。

Anthropicのレポートは何を警告していますか?

Anthropicのレポートは、AIが自律的に後継AIを設計する可能性とそのリスクについて警鐘を鳴らしています。

AIの進化を管理する方法はありますか?

AIの進化を管理するためには、国際的な合意や一時停止メカニズムの整備が必要とされています。

Sec.07

参考文献

- Anthropic「Recursive Self-Improvement」(Anthropic Institute)

Key Takeaways

この記事の要点

Anthropic社内ではClaudeがマージ済みコードの80%超を書き、エンジニアの出荷量は8倍に増えている（2026年6月公表）
Anthropicは3つの未来シナリオ（プラトー／人間主導／完全RSI）を提示し、RSI到達前の『検証可能なグローバル一時停止』を提言した
ゲイリー・マーカスやScientific American寄稿者は『16時間タスクは証拠不足』『自社宣伝バイアス』と批判している
METR自身が『16時間超の測定は現行スイートでは信頼性が低い』と注記しており、数字の解釈には留保が必要
Claude Codeを使う非エンジニアも、ログを残し小さく試し一次情報を追うことで、この議論の当事者として参加できる

Conclusion

まとめ

AIが自らのコードの80%を執筆する時代が到来しました。Anthropicが公表したこの事実は、私たちがAIの進化の最前線にいることを示しています。しかし、完全な再帰的自己改善 (RSI) にはまだ到達していません。Anthropicは、AIが自律的に後継AIを設計・開発する能力を持つことを警戒し、グローバルな一時停止メカニズムが必要だと訴えています。一方で、この警告を「煽りすぎだ」と退ける声も無視できません。AI研究者のゲイリー・マーカスは、Anthropicの警告を「煽りすぎ」とし、16時間のソフトウェアタスクをRSIの証拠と見なすのは見当違いだと指摘しています。METR自身、測定上限を超える評価の信頼性には限界があると認めているほどです。これらの批判は、AIの進化に対する慎重な姿勢を求める声と相まって、AI開発の透明性と信頼性の向上を促します。つまり、AIの進化には多角的な視点が欠かせません。レポートが示す未来は一本道ではありません。「プラトー（頭打ち）」「人間主導の加速」「完全RSI」という三つのシナリオが提示されており、どれを辿るかで私たちの備え方も変わります。特に「完全RSI」は、科学や医療に大きな恩恵をもたらす可能性がある一方で、人間の制御を失うリスクも伴います。だからこそAnthropicは「恩恵を取りにいく前に、制御の仕組みを整えよ」という順序を示したのです。私たちがClaude Codeを使って業務ツールを開発する行為そのものが、この巨大な議論の一端に位置しています。非エンジニアでも、自分の手元でAIの働きを観察し、理解を深めてください。これが、煽りや楽観に偏らず、AIの進化に誠実に参加する最も現実的な方法です。AIの可能性とリスクを理解し、適切に活用することが、これからのAI時代を生き抜く鍵となるでしょう。

Anthropicの警告: AIが自律的に後継AIを作り出すリスクとは？

Claude Code を 10日で実装力に。