AIエンジニアがLinear Aを解読したと主張
(aiclambake.com)- 青銅器時代のミノア文字 Linear A は100年以上にわたり未解読のままで、Tom Di Minoの解読案が正しければ言語学における大きな出来事になり得る
- Di MinoはLinear Aを聖書ヘブライ語の先行言語に近い 消滅したセム語 と見ており、RutgersとCambridgeの言語学専門家がこれを検討中
- 解読の難しさは資料不足と 在庫目録中心の碑文、Linear Bにはない13個の記号のために増しており、過去のセム語説も広く受け入れられてこなかった
- 重要な手がかりは2026年5月22日にLinear Aの祈祷文の定型から得られ、Di Minoは専用記号
*301をnaと読んで N-W-Y 語根と「住む」という意味を結びつけた - Claude CodeでGORILAとSigLAベースのコーパスをクエリ・相互参照した結果、Di Minoは40個の記号読解、408個の語彙の英訳、9ページの論文草稿を作成した
Linear A解読案の現在地
- Tom Di Mino はHudson Valley在住の独学のAIエンジニア兼アマチュア言語学者で、青銅器時代のミノア文字 Linear A を解読したと主張している
- この解読案は現在 Rutgers と Cambridge の言語学専門家によって検討されている
- Di Minoは18歳から古代史、言語学、言語を学び、Linear Aを7年間調べ、クレタ島を2回訪れている
- 2026年1月にLinear Aの解読作業を始め、主な洞察は5月22日に得たと述べている
- 解読が事実と確認されれば、言語学分野の大きな出来事になり得る
- 関連するミノア文字 Linear B は1952年に解読され、当時New York Timesの1面を飾った
Di Minoの言語系統解釈
- Di MinoはLinear Aを 消滅したセム語 系統として解釈している
- 聖書ヘブライ語の先行言語であり、ラテン語とイタリア語の関係に近いと見ている
- Linear Aセム語説は新しい主張ではない
- Cyrus Gordon は1957年の Antiquity 論文で類似の解釈を提示した
- 既存の試みはDi Minoの手法のように翻訳へはつながらず、Gordonの研究も学界で広く受け入れられなかった
Linear AとLinear Bが分かれる地点
- Linear A は紀元前1800年ごろに登場し、紀元前1450年まで使われたミノア文字である
- 紀元前1450年にクレタ島がミケーネ・ギリシャ人に征服されると使用は終わった
- ミケーネ・ギリシャ人はミノア記号の一部を修正して使い、このミケーネ・ギリシャ版が Linear B である
- 両文字はタブレット、壺、そのほか当時の遺物から見つかっている
- 中核単位は文字ではなく 音節 である
- 音節はおおむね子音-母音の組で構成される
- 両体系は60個の中核音節記号を共有し、単語全体を表す ロゴグラム も併用する
既存の解読が行き詰まっていた理由
- Linear B は1952年、英国の建築家・暗号研究者・アマチュア言語学者であるMichael Ventrisによってギリシャ語と特定され解読された
- Brooklyn College教授 Alice Kober の先行研究がVentrisの突破口に寄与した可能性がある
- KoberとVentrisは記号位置と変化パターンを見つけるために 文法・統計分析 を用いた
- 先頭の音節が母音である可能性のようなパターンを調べていた
- Linear B碑文はLinear Aよりはるかに多く、解読に有利だった
- Linear A碑文のかなりの部分は商品の取引を記録した 在庫目録 であり、言語そのものを把握する手がかりが少ない
- 両文字が60個の記号を共有し、Linear Bがすでに解読されていたため、専門家は重複するLinear A記号の音を一部推定できた
- 問題は、その音が何を意味するのか分からなかった点にある
- Linear AにはLinear Bにない13個の追加記号があり、これらの音価には受け入れられた解釈がなかった
5月22日の祈祷文の手がかり
- Di Minoは2026年5月22日、一定の定型に従う Linear Aの祈祷文 の連続碑文を分析していた
- その定型では各行のすべての語がLinear B音節との重複をもとに既知だったが、最初の語だけが未解決のままだった
- 最初の語は同じ 動詞語根 を持つように見え、島の5つの聖所地域で異なる地域形として現れていた
- その動詞には既知のLinear B記号5個と、Linear A専用記号と見られる
*301が含まれていた- Di Minoは
*301をnaと読んだ - これによって
nawayaという語根を解き、その意味を「住む」と見た - ヘブライ語、Akkadian、および他のセム語には3子音体系があり、N-W-Y は「住む」または「生きる」を意味する動詞や名詞に使われる
- Di Minoは
- 解読後、Di Minoはその祈祷文が後世のヘブライ語の祈りに似ているが、対象は 女神 だと解釈した
過去のセム語説との違い
- Cyrus GordonはLinear Aの奉納タブレットと、自身が翻訳したAkkadian・Phoenicianの類似タブレットとのつながりを提案したことがある
- Di MinoはLinear A碑文と ヘブライ語の祈り のつながりを識別した最初の人物だと主張している
- この洞察は祈祷文碑文の動詞を解くことにとどまらず、Linear Aの ロゴグラム 使用をより広く理解する助けにもなり得る
- Di MinoはLinear Aロゴグラムに関する自身の解釈がLinear Bの一部の翻訳上の問題も解決し、結果を検証すると見ている
AIツールで作ったコーパス作業と成果物
- Di Minoは Claude Code でPythonスクリプト群を作成した
- これらのスクリプトはGORILAとSigLAデータベースから取得したデジタルLinear Aコーパスをクエリし、相互参照し、整理する
- 手作業では非現実的だった規模の体系的な仮説検証が可能になった
- 研究成果として40個の文字記号の読解を提案している
- これには以前は音価が不明だった13個の記号が含まれる
- これまで不明だったLinear B記号5個の音価も解決したと主張している
- 408個のLinear A語彙 を英語に翻訳した語彙集を作成した
- Ya Diktu: Grammar of the Minoan Peak Sanctuary Libation Formula という9ページの原稿草稿も作成した
- この草稿は査読付き学術誌への投稿の土台になり得る
1件のコメント
Hacker Newsのコメント
このパズルに魅了されているアマチュアとして、この主張のもっともらしさを判断する助けになりそうな背景を補足すると次のとおり
著者が翻訳の土台にしている Libation Formula は、Linear A で最も研究されている文句で、文法的な変形を含めて繰り返し現れる唯一の句だからだ
コーパス全体は極度に断片的で、長いテキストもいくつかしかなく、それでも英語の平均的な文程度の長さしかない。大半は在庫・人員・奉納物のような一覧で、長いテキストには語の区切りを示すように見える句読点があり、かなりの語彙を与えてくれるものの、既知のどの言語にも一致しない
これほど残存資料が少ないと、a) 私たちが Linear A と呼んでいるすべてのテキストが同じ言語なのか、b) 判別できる単語が略語ではないのか、という点すら確信しにくい
著者は、Linear B に対応文字がある Linear A の記号は同じ音価を持つと仮定している。したがって、すでに “NA” を表していた文字を使えることになる。「重複」文字は P 系列にしか見られず、Linear A の言語では区別されていたがギリシャ語にはなかった音節、たとえば帯気/無気の P のようなものを表していたと推定される。Linear B には “NWA” の文字があり、Linear A でも例が見つかっている
古代ギリシャ語には語源不明の単語が非常に多く、ギリシャ人が現在の居住地へ移住した当時その地域で使われていた 基層言語 に由来すると考えられている。Linear A の言語はそうした基層の有力候補かもしれない。もし Linear A がセム語だったなら、それらの単語について、ギリシャ語に残った形からすでにセム語の語源が立てられるはずだ。もちろん、それらの単語が文字を採用しなかった別の言語、あるいは文字資料が伝わっていない別の言語から来た可能性もある
Dr. Ester Salgarella にも連絡してあるので、コーパスに 計算分析 を適用しようとする試みや、以前のアプローチがどこで誤っていたのかは把握している
もしクレタのギリシャ以前の住民がセム語を話していたなら、とりわけ地名にこの種の借用語がもっと多くあるはずだ
ギリシャ語、Linear B、セム語をあわせて見ると、関連する Cypriot syllabary はフェニキア語とギリシャ語の二言語碑文のおかげで解読された: https://en.wikipedia.org/wiki/Idalion_bilingual
そしてクレタと同様、同じ文字で書かれていながら、いまだ解読されていないギリシャ以前の言語もある: https://en.wikipedia.org/wiki/Eteocypriot_language
当時の口語ギリシャ語は、印欧祖語や後の古典ギリシャ語と同様に、帯気と無気の無声閉鎖音 をほぼ確実に区別していたはずで、もし Linear A の言語にそうした区別があったなら、なぜギリシャ人がそれを Linear B に持ち込まなかったのか。むしろ、Linear A の言語または文字にその区別がなく、だから Linear B にも現れないと見るほうがずっともっともらしい
すでにかなり研究されてきた句で進展があったという事実は、むしろ懐疑的になる理由のようにも思えるが、どう判断しているのか知りたい
こういう主張をする変わり者は多いが、Tom の仕事は Rutgers と Cambridge の言語学専門家が検討するだけの信頼性を十分に備えている
追加の検証根拠として、彼のアプローチは結果を出している。彼は 300語を超える単語 を翻訳し、以前には誰も成し遂げられなかったことであり、彼の解法は Linear B のいくつかの問題も実際に解いている
Tom は AI エンジニアで、Claude Code が作業の中核だった。利益相反の開示として言うと、私は Tom を個人的に知っており、リンクされた記事は私が書いた
Rutgers と Cambridge の何人かにメールで送ったという意味なのか、それとも何らかの形の 匿名でない査読 を受けているという意味なのか?
パズルを解くのに Claude をどう活用したのか、もっと聞いてみたい
シニカルに見れば、完全に確認される前に早く出しすぎて、彼の手柄を少し奪っているようにも見えるかもしれない
“Di Mino used Claude Code to build a suite of Python scripts that query, cross-reference, and organize the digitized Linear A corpus (drawn from the GORILA and SigLA databases), enabling systematic hypothesis testing at a scale that would have been impractical to do manually.”
Claude がこうしたプロジェクトで使われているなら、まさにこうあってほしい形だ。問題をブラックボックスのように「解かせる」のではなく、道具を作るために使うということ
Linear Aが難しい理由は、現存する全文字列が約7,500字しかなく、しかも約1,500件の碑文に散らばっているからである
4K画面があれば、残っているLinear Aの全文字列を14ポイントのフォントで1画面にすべて収められる
また、よくある別の種類は1〜2文字が刻まれた小さな粘土封印である。どちらの場合も略記を扱っている可能性が高い
一部の一覧は「ku-ro」と数字で終わるが、その数字は前の数字の合計であり、奇妙なことによく1だけずれている
ミノア人がなぜヘブライ語を書いたのかは分からない。私の知る限り、ミノア文明とヘブライ語話者のあいだに広範な文化交流があったことを示す兆候はない
死文字の翻訳の難易度にはかなり明確な序列がある。易しいものから難しいものへ並べると、a) 文字がどの言語をどう書き表すかも分かっている場合、b1) どの言語かは不明だが文字体系がどう記録するかは分かっている場合、b2) どの言語かは分かるが文字体系が不明な場合、c) 言語も文字体系も不明な場合である
b1とb2はおおむね同程度の難しさであり、Linear Aはc)に入る。Linear AがLinear Bでミュケナイ・ギリシャ語を書くために再利用されたという事実以外、文字とその言語についてはほとんど分かっていない
完全に同じではないが、文字列が少なすぎるため、可能な解釈が数多く残ってしまう
私の知る限り、核心的な問題はLinear Aの文字コーパスがかなり小さいことだ。他のコメントによれば、全体で7,500個の記号しかなく、1,500件の碑文に散らばっているので、碑文1件あたり平均5記号しかないことになる
もう一つ奇妙なのは、これがセム語だと判明したという部分である。セム語なら、すでに解読されていてもよさそうに思える。言語学者たちがセム語を当然、しかも執拗に検討してきたはずだからだ
そしてセム語なのだとしたら、なぜ母音を持つ音節文字であって、子音文字体系ではないのかも疑問である。普通セム語は、たぶんエジプト語もそうだが、語幹が3つの子音からなり、そのあいだに母音が織り込まれて単語が作られるため、子音だけを書き表す
たとえばセム語根K-T-Bは、kataba、yaktubu、kitāb、kutub、kātib、maktūb、maktab、maktabahのように、母音が間に入ることでさまざまな語になる。D-R-Sもdarasa、yadrusu、dirāsah、dāris、madrūs、madrasahのように変化する
このような三子音語根体系があるため、セム語は普通母音を書かないが、Linear Aがセム語だったとしたら、なぜ子音+母音の音節文字だったのだろうか?
時制、受動/能動、名詞化などを区別でき、言い換えれば同じ語根から派生した複数の語を互いに区別できるからである
とても興味深く、Tomの成果を祝福したい
ただし明確にしておくと、これは解読の試みである。まだ証明されたわけではなく、その分野の専門家が検討するまでは、Linear Aが「解けた」と見なすべきではない
実際、さらに多くのLinear A文献が見つかり、それらが提案された方法と一致しない限り、「証明」と見なすのは難しいだろう。現時点で確実に言えるのは、興味深い仮説だという程度である
それでも追いかける価値のある話ではある。本当に正しい可能性もある。今後さらに研究と検証が続く必要があり、これから数週間から数か月のうちに、Linear Aが本当に解読されたのかどうか、もっとよく分かるようになるだろう。少なくとも興味深い試みであり、楽観的に見ればミノア文化への実際の洞察を与えるかもしれない
Linear Aの大きな問題は、記号が少なすぎるので、比較的簡単に「解ける」一方で、それが正しいのかどうかを知る方法がないことではないか?
もし事実だと判明すれば、印欧語族とセム語族を結びつける扉が少し開くことになるだろう
20世紀初頭には両語族が関連していると考えられていたが、その後は流行から外れた。初期にそこまで誤り得た理由は、両語族が絡み合っていたからである。現在では、両言語がCaucasusのごく近くから広がったことを示す遺伝的証拠がある
大半の人にはもう古い話だろうが、この15年ほどで、ヨーロッパが一度はAnatolianたちによって、その後一部はIndo-Europeanたちによって完全に再定住したことが明らかになった。Anatolianたちの言語はまだ分かっていない
偶然の一致、ときには実際の借用語、そして一部の人々のバイアスのためである
ちょっと待って、Phaistos discでも同じLibation Formulaが出てくるのを見たことがある。フォントが入っている10人くらいのために書くと、次のようになる
𐇑 𐇘 𐇪 𐇐 | 𐇬 𐇳 𐇖 𐇗𐇽 | 𐇬 𐇗 𐇜 | 𐇬 𐇼 𐇖𐇽 | 𐇥 𐇬 𐇳 𐇖 𐇗𐇽 | 𐇪 𐇱 𐇦 𐇨 | 𐇖 𐇡 𐇲 | 𐇖 𐇼 𐇖𐇽 | 𐇖 𐇡 𐇲 | 𐇥 𐇬 𐇳 𐇖 𐇗𐇽
i-𐇘-wi-jeʳ | ʰau-ni-ti-noʳ au-no-pa au-ndi-tiʳ 𐇥-au-ni-ti-noʳ wa-pi-naᵐwa ti-ru-te ti-nd-tri ti-na-ru-he ʰau-ni-ti-noʳ
i-301-wa-ja/e | ʰau-... jaᵘ-di-ki-to i-pi-na-ma si-ru-te ta-na-ra te-ti-u ta-na-te i-da
𐘚 ᴴI 𐘮 WA 𐘱 JA 𐘱 JA 𐘆 DI 𐘸 KI 𐘹 TU 𐘚 ᴴI 𐘢 PI 𐘅 NA 𐙁 MA ()
ここでのPhaistosの音価は類似性に基づいて定められているようだ
最後の文字()だけまだ欠けているが、それがどのフォントなのか気になる