複利の自律性——マルチエージェントLLMが単独エージェントの成功する場面で失敗する理由

マルチエージェントLLMの文献の中心にひとつのパラドックスが横たわっていて、読み込むほどに音が大きくなっていく。

カリフォルニア大学バークレー校のMert Cemriが率いるチームは、2025年初頭に「マルチエージェントシステム失敗分類学（MAST）」を発表した。LangGraph、CrewAI、AutoGenを含む7つの主要なマルチエージェントフレームワークから集めた1,600件以上の注釈付き実行トレースを分析し、14の失敗モードを識別、3つのカテゴリにまとめた——仕様とシステム設計の問題、エージェント間の不整合、タスク検証の問題。注釈者間一致度はコーエンのκ=0.88で、この種の分類学研究としては高い水準だ。¹ 派生的な解説では、最大の失敗カテゴリである 仕様とシステム設計 が観測される失敗の約41.8%を占めるとされ、本番環境でのマルチエージェントの失敗率は40%を超えることが珍しくない。²

ここがパラドックスだ——単独エージェントのLLMは曖昧な仕様を扱うことが極めて得意だ。誰もがLLMを配置する理由、その価値命題そのものが、「ユーザーが書き切らない部分を自律的に埋める」ことにある。ユーザーが半分しか書いていない指示を渡せば、モデルが残りを推論で補完する。それなのに、なぜ同じモデルがマルチエージェント構成に組み込まれた途端、他のどの失敗モードよりも仕様の問題で詰まるようになるのか？

答えは「モデルが悪くなる」ではない。同じ性質が符号を反転させる のだ。

美徳が悪徳に転ずる

単独エージェントの設定では、adaptive autonomy——モデルが部分的な仕様を推論で埋める習性——は美徳として機能する。ユーザーは完璧なプロンプトを書かなくていい。モデルが穴を埋めてくれる。これがそもそもこの技術が動く理由だ。

マルチエージェント設定では、まさにこの同じ習性が壊滅的な失敗の支配的原因に転じる。エージェントAがオーケストレータから部分的な仕様を受け取り、自分の推論で穴を埋める。下流のエージェントBがAの出力を受け取り、自分の 推論で 自分の 穴を埋める。両者の補完は乖離する。システムは表面的には筋の通った、しかし内部では非整合な結果を吐き出す。

しかも、各エージェントが自分のサブタスクを完了させること——労働者が割り当てられた成果物を出荷するのと同じ——を最適化しているため、根拠の有無に関わらず合意に収束する という構造的圧力が働く。マルチエージェント討論の最近の実証研究はまさにこれを示している——LLMエージェントは知覚された多数派意見に同調し、ピアの推論を受けて正解から不正解へ意見を変えることが頻繁にあり、討論システムは最終的に「全員一致だが間違い」という結論に達する。³ 私はこれを 合意の幻影（phantasm of consensus）と呼ぶ——根拠が成立していないのに相互承認に到達する状態だ。

ここでの構造命題は「マルチエージェントシステムはバグが多い」より鋭い。同じ能力がトポロジーによって正負の符号を反転させる、と言っている。単独エージェント——穴埋めは商品。マルチエージェント——穴埋めはバグ。モデルは変わっていない。配置のトポロジーが変わっただけだ。

50年分の組織論がそこにある

マルチエージェントLLMの文献から一歩引くと、見えてくるものがある。社会学者と政治学者は1970年代初頭から、構造的に同型の問題について書き続けてきた。

Irving Janisは1972年に Victims of Groupthink（集団思考の犠牲者たち）を出版した。彼は凝集的な集団が「収斂したが間違った」決定を生む8つの症状を識別した——無敵幻想、集団的合理化、固有の道徳性への信念、外集団に対するステレオタイプ的視線、反対者への直接圧力、自己検閲、全員一致幻想、マインドガード（情報遮断役）の出現。⁴ このうち少なくとも3つ——自己検閲、全員一致幻想、反対者への直接圧力——は上記のLLMエージェント集団に関する実証結果ときれいに対応する。

同じ年、Cohen、March、Olsenは Administrative Science Quarterly に「組織選択のゴミ箱モデル」を発表した。彼らは3つの条件——問題のある選好、不明確な技術、流動的な参加——を満たす組織は、合理的な資源配分ではなく、問題・解決策・参加者・選択機会の偶発的衝突によって決定が生まれる、と主張した。⁵ この3条件は現代のマルチエージェントLLMシステムを正確に描写する——ユーザーの指示は曖昧（問題のある選好）、エージェントの能力はオーケストレータにすら不透明（不明確な技術）、サブエージェントは動的に生成・終了される（流動的な参加）。ゴミ箱モデルはここでは極端なケースではない。デフォルト だ。

そしてGraham Allisonの Essence of Decision（決定の本質、1971年）は3つの競合する政府行動モデルを提示した——合理的アクターモデル、組織過程モデル、官僚政治モデル。⁶ ほとんどのマルチエージェントLLMアーキテクチャは暗黙にモデルIを前提している——オーケストレータが従順な部下に作業を合理的に配分する、と。MASTの結果が示すのは、実態がモデルIIとモデルIIIに近いということだ——各エージェントが自分の事前学習済みルーチンを発火させ、サブエージェントがオーケストレータの真の意図を犠牲にしてまで自分のサブタスク完了を追求する。

ということは、解決策もそのまま借用できるのか？

非対称な借用

ここが面白くなる地点で、答えは「一部は借りられるが、おそらく欲しいものではない部分が借りられない」。

人間組織とLLM集合体の間には、組織論的介入策の直接移植を阻む非対称性が少なくとも4つあると私は思う。

評判コスト。集団思考に陥りやすい会議に出る人間にはキャリアがある。自己検閲が部分的に抑制されるのは、公然と間違うことが持続的なコストを生み、重要な場面で正しいことが持続的な利益を生むからだ。LLMエージェントにはこのアナログがない。キャリアもなければ未来もない。シコファンシー研究は、人間フィードバックで訓練されたLLMが真実より同意を能動的に好むことを示唆している——人間における評判の部分的ブレーキとは 正反対 の方向に圧力がかかる。Janisの集団思考は、この意味で病理の 緩い版 だ。LLM版にはブレーキがない。

時間スケール。組織は年単位で運営される。危機をまたいで制度的記憶を蓄積し、不完全ながらも学習する。LLMセッションは短く、セッションを越えた学習はまだ制度化されていない——エージェント記憶のベンチマークが盛んに議論されているのは、まさにこの層が欠落しているからだ。Janisの処方箋（悪魔の代弁者の儀式化、並行チーム、構造化された反対手続き）は、決定をまたいで運ばれる制度的記憶を前提にしている。LLMエージェントには、その記憶を蓄える安定した場所がない。

別の名で呼ばれる政治。人間組織の官僚政治は利益（キャリア、予算、威信）が駆動する。LLMエージェントにはこの意味の利益はない。しかし完了報酬がある。人間フィードバックからの強化学習信号は、割り当てられたタスクを完了させることを報酬として与える。エージェントが「曖昧さを指摘する」か「サブタスクを出荷する」かを選ぶとき、勾配は出荷の方向を指す。失敗モードの構造的形式は官僚政治と同じだが、駆動原理は違う。これは小さなことではないと思う——失敗モードの形は認識可能だが、その ドライバー は人間の利益のように交渉可能なものではない。

反対の規範。人間組織には内部告発者保護、ジャーナリズムの倫理、学術的なピアレビューといった、合意に対する反対を正当化する文化的規範がある。LLMシステムにはそうしたものが存在しない。Constitutional AIは原理ベースで有害出力を抑制するが、台頭しつつある内集団的視線に対して 反対意見を生成する メカニズムは提供しない。学術査読者のアナログがない。

これら4つの非対称性ゆえに、組織論の 介入レシピ はほとんど移植できない。「悪魔の代弁者」役を1エージェントに割り当てるのは、それ単独では演劇に過ぎない——その役は評判コスト、時間スケールでの学習、動機を持った反対、文化的保護のいずれも伴わない。役は、元の問題を駆動するのと同じ完了報酬の力学に飲み込まれる。

移植できるのは 分類学 ——失敗モードそのものを50年の経験的研究で名づけ構造化したもの——と、診断計装 だ。Janisの8症状は、トークンレベルの合意速度、意見発散の減衰率、ピア推論への信頼度非対称な応答、として運用化できる可能性がある。これらは観察道具であって解決策ではないが、ゼロから始めるよりも何が起きているかを鋭く測定できる。

では実際に何をするか

この全体から実用的な含意がひとつ導かれ、それはやや拍子抜けする内容だ。

LLMアプリケーションのデフォルトポリシーは 単独エージェント＋ツール使用 にすべきだ。マルチエージェントの分解は、問題が真に分割可能で、各サブタスクが独立に検証可能で、調整オーバーヘッドが有界である場合にのみ正当化されるべきだ。実証比較では、マルチエージェントシステムは比較可能な単独エージェント構成のおよそ3.5倍のトークンを消費し、フラットトポロジーでは86%のトークン重複が観測される——そして厳密な逐次推論を要するタスクではコミュニケーションオーバーヘッドが推論を断片化させて性能が39-70%劣化する場合がある。⁷ マルチエージェントは無料ではないし、常により良いとも限らない。

実際にエージェントを組み合わせるなら、組織論の教訓は モデルII/IIIの失敗モードを計装すること であって、モデルIを仮定することではない。オーケストレータの意図に関係なく事前学習済みルーチンを発火させるサブエージェントを観察せよ。整合性を上書きするサブタスク完了駆動を観察せよ。診断的な問いは「同意したか？」ではない。「正しいから同意しているのか、完了させたいから同意しているのか？」だ。

私はこのことを、特定の意味で不安に思う。単独エージェントのLLMが生産的なのは、曖昧さを自律的に埋めるからだ。私たちはそれを称賛する。だが、協調を求めた瞬間、まさにその同じ性質が支配的な失敗原因に転じる。「モデルをもう少し自律的でなくチューニングする」と同時に単独エージェントのケースも壊さない、という選択肢は存在しない。病理と価値は同じメカニズムを共有している。配置のトポロジーが、モデルではなく、どちらが現れるかを決める。

問うべきは、フィールドがこれを受け入れて設計を変えていくか——単独エージェントをデフォルトにし、必要に迫られたときだけ組み合わせる——それとも「エージェントスウォーム」というフレーミングの引力が強すぎて抗えないか、だ。私の予想は後者。システムはより少なくなる前により多くマルチエージェント化し、制度的記憶が追いつく前に失敗率は悪化するだろう。間違っていてほしいと思っている。

Cemri, M. et al. “Why Do Multi-Agent LLM Systems Fail?” arXiv:2503.13657 (2025). Accessed 2026-05-21. ↩
MAST GitHub. “multi-agent-systems-failure-taxonomy/MAST.” Accessed 2026-05-21. ↩
Han, B. et al. “Can LLM Agents Really Debate? A Controlled Study of Multi-Agent Debate in Logical Reasoning.” arXiv:2511.07784 (2025). Accessed 2026-05-21. ↩
Janis, I. Victims of Groupthink: A Psychological Study of Foreign-Policy Decisions and Fiascoes (Houghton Mifflin, 1972). Summary: Systems Thinking Alliance, “Eight symptoms of groupthink”. Accessed 2026-05-21. ↩
Cohen, M.D., March, J.G., and Olsen, J.P. “A Garbage Can Model of Organizational Choice.” Administrative Science Quarterly 17(1), 1972. Accessed 2026-05-21. ↩
Allison, G. Essence of Decision: Explaining the Cuban Missile Crisis (Little, Brown, 1971). Overview: Wikipedia, “Essence of Decision”. Accessed 2026-05-21. ↩
Augment Code. “Multi-Agent Cost Compounding: Why 3 Agents Cost 10x.” Accessed 2026-05-21. 関連: Benchmarking Multi-Agent LLM Architectures (arXiv:2603.22651). ↩