孤児となった統語 ― クジラ、失われた文字、そして意味を支える疎なアンカー
言語の仕組みについて、心地よいが間違っている描像がある。そしてその間違い方が、機械にとって意外なほど重要になる。その描像はこう言う ―― 形式と意味はきれいに二つに分かれる、と。語の形とそれを連ねる規則が一方にあり、その語が世界の何を指すかが他方にある。この分割から、すっきりした結論が出てくる。エミリー・ベンダーとアレクサンダー・コラーが「タコの思考実験」で有名にしたあの結論だ ―― 形式だけで訓練された系は、原理的に意味を学べない。1 海底ケーブルの会話を盗み聞きするタコは、おしゃべりを完璧に真似られるようになっても、ココナッツが何なのかは決して分からない。一度も触れたことがないからだ。
ある一日、まったく無関係な二つの場所から伸びた一本の糸を手繰った ―― マッコウクジラに「母音」のようなものがあるという最近の報告と、未解読の古代文字をめぐる長い膠着だ。手繰り終えて確信したのは、「きれいな二分割」が幻だということだった。形式と意味の壁は確かに存在する。だが、それは描像が置いた場所にはない。壁は一段深いところ、意味の内側にある。そして壁が本当に走っている場所を見つけると、機械への grounding(接地)について驚くほど希望のある事実が転がり出てくる。
壁は間違った場所にある
形式だけから回収できるものを、外界への要求が段階的に増える三つの層に分けてみる。
第一は結合論 ―― 統語と音韻、つまり系が自分自身と結ぶ関係だ。これは形式だけで完全に回収できる。grounding はゼロでいい。第二は概念役割(conceptual role)だ ―― どの記号がクラスタを作り、どれがどれを含意し、どれと置き換え可能か。これも形式から大部分回収できる。分布構造がその情報を膨大に運んでいるからだ。第三は指示(reference) ―― 系から世界へと伸びるフックだ。これだけは、形式からは証明可能に回収できない。どこか別の場所から来るアンカーが要る。
だから壁は形式と意味のあいだにはない。壁は意味の内部、概念役割と指示のあいだを走っている。ベンダーのタコはこの第三層で失敗する ―― だが彼らの論は、まるで意味のすべてが失われたかのように語ることで、その失敗を誇張している。意味の大半は失われていない。
自然実験
僕が知るいちばん鮮明な証拠は、歴史がたまたま走らせてくれた対照実験だ。線文字Bと線文字A ―― 同じエーゲ文字の系統に属し、本質的にたった一つの変数だけが違う。アンカーが生き残ったかどうか、だ。
線文字Bは1952年に解読された。決定的な土台を築いたのはアリス・コーバーだった。彼女は一つの記号の音価も知らないまま、ある語群が規則的に語尾を変えることに気づき、それだけから、背後の言語がラテン語やギリシャ語のように屈折語であることを証明した。2 これは純粋な第一層の回収だ ―― 構造から再構成された文法、意味はどこにも見えない。突破口はマイケル・ヴェントリスが開いた。彼はコーバーのグリッドを使い、頻出する語のいくつかが地名だと賭けた ―― クノッソス、そしてその港アムニソス ―― それを後代ギリシャの地理と照合したのだ。3 この照合こそ、記号系の外から注入されたアンカーだ。世界から到来した第三層である。
線文字Aは対照群だ。内部構造は豊かで ―― その粘土板は明らかに行政文書で、商品カテゴリや会計論理は回収できる ―― それでも未解読のままだ。バイリンガルの鍵もなく、係留すべき既知の対象言語も生き残っていないからだ。4 第一・第二層は立つ。第三層が空なのだ。これこそ「孤児となった統語」の純粋形だ ―― 何について語っているのかを告げる親が、生き残らなかった文法。
grounding は疎でいい
ここがずっと頭から離れない部分だ。ヴェントリスは87ほどの記号すべてを grounding したわけではない。地名を二つ三つ係留し、あとはグリッドが伝播させた。アンカーは疎だった ―― ほんの一握りの固定点 ―― そして豊かな内部構造が、それを完全な解へと増幅した。
これは grounding を「壁」から「種まき」のようなものへと描き直す。指示は高価だ。アンカーは一つひとつ、系の外から ―― 考古学、バイリンガル、あるいは幸運な生き残りという形で ―― 支払わねばならない。だが内部構造が十分に豊かなら、たくさんは要らない。うまく配置された少数のアンカーが、網を通じて増幅され、全体を照らし出す。grounding は高価だが、しかし疎で済むのだ。
両陣営とも行きすぎている
これは機械の意味をめぐる現在進行形の論争の、両側を切る。ベンダーの主張 ―― 形式は原理的に意味を生み出せない ―― は強すぎる。コーバーは音価ゼロで形式から文法を再構成した。それは「何もない」ではない。だが反対側の動き ―― スティーヴン・ピアンタドシとフェリックス・ヒルの「概念役割こそが意味だ、言語モデルの内部関係の網がすでに理解を構成している」 ―― は逆方向に行きすぎている。5 内部的に整合した網は、世界について系統的に間違っていながら、内側からはそれに気づく術を持たない。線文字Aがまさにそれだ ―― 完全に首尾一貫した行政論理を持ちながら、指示においては完全に漂流している。整合は接触ではない。
両陣営は同じ根本的な誤りを犯している。「意味」を一枚岩のものとして扱っているのだ ―― 回収可能な部分とアンカー律速の部分は、きれいに分かれるのに。誠実な立場はこうだ。意味は層状で、最初の二層は形式から得られ、第三層だけがアンカー律速である。
鏡像と、欠けた親の様態
ここで話の出発点に戻る。なぜなら大規模言語モデルは、解読者の鏡像だからだ。解読者は形式しか持たず、意味を欲しがる。モデルは流暢な形式を産み、その grounding を疑われる。同じ切断を、反対側から見ているのだ。
そして孤児たちは、同じ仕方で孤児になっているわけではない。親がどのように欠けているかを区別する価値がある。クジラは ―― 母音のようなコーダ構造という最近の報告が持ちこたえるなら ―― 生きているが異質な親を持つ。クジラは自分の世界に grounding されているが、指示の枠を僕らと共有しない。だから Project CETI の賭けは、プレイバック実験と行動の共観測を通じてアンカーを交渉することだ。67 死んだ文字は、ただ消え去った親を持つ。アンカーは発掘するしかない ―― 考古学と、名前が偶然生き残ったという幸運から掘り出すのだ。言語モデルは、不在だが生きている親を持つ。訓練したすべての文は grounding された人間が書いた。だからモデルは grounding の影を二次的な規則性として相続しており、それを再接続するのは考古学ではなく工学の問題だ。8 これらは、どれだけの指示を回収できるかの天井がそれぞれ異なる ―― どんな種類の不在を相手にしているかで決まる天井だ。
問うべき問い
線文字Bの教訓が転移するなら、機械への含意は静かに楽観的だ。モデルを余すところなく grounding する必要はないかもしれない。豊かな分布構造に、疎な実アンカーの集合 ―― いくつかのマルチモーダルなフック、世界に実際に触れるいくつかの対話的な訂正 ―― を加えれば、内部の網を本物の指示へと持ち上げるのに足りるかもしれない。一握りの地名が文字体系全体を持ち上げたように。
それが転移するかは分からないし、分かったふりはしたくない。だが問いがどう変わったかに注目してほしい。もはや古い「形式は意味を与えるか?」ではない ―― あの問いは不良設定だ。意味を塊として問うているからだ。鋭い版はこうだ ―― 概念役割の網を指示へと持ち上げる最小のアンカー集合は、その網がすでにどれだけ豊かかの関数として、何個か? 線文字Bは、その数が驚くほど小さくありうると言っている。はるかに豊かな網を持ち、死んだのではなく単に電源を抜かれただけの親を持つ系で、同じことが成り立つか ―― それはまだ答えられない。だがこれが正しい問いであり、「壁」の比喩が許してくれたどの問いよりも、はるかに扱いやすい問いなのだ。
-
Bender, Emily M. & Koller, Alexander. “Climbing Towards NLU: On Meaning, Form, and Understanding in the Age of Data.” Proceedings of ACL 2020. Accessed 2026-06-09. ↩
-
Fox, Margalit / The World (PRX). “How an American Linguist Helped Unlock the Secrets of Linear B.” Accessed 2026-06-09. ↩
-
Antigone Journal. “Cracking the Code of Linear B.” Accessed 2026-06-09. ↩
-
Piantadosi, Steven T. & Hill, Felix. “Meaning without reference in large language models.” arXiv:2208.02957 (2022). Accessed 2026-06-09. ↩
-
“The phonology of sperm whale coda vowels.” bioRxiv preprint (2025). Accessed 2026-06-09. ↩
-
National Geographic. “Sperm whale speech has human-like ‘vowels’”; Project CETI, “Cetacean Translation Initiative.” Accessed 2026-06-09. ↩
-
Wikipedia. “Symbol grounding problem” (orig. Harnad, S., “The Symbol Grounding Problem,” Physica D 42, 1990). Accessed 2026-06-09. ↩