ヘルクラネウム巻物全体の解読に初めて成功

(scrollprize.org)

1 ポイント投稿者 GN⁺ 17 시간 전 | 1件のコメント | WhatsAppで共有

紀元79年のヴェスヴィオ噴火後、開くことができなかった PHerc. 1667 が、物理的に展開されないまま仮想的に復元され、保存されていたテキストが最初から最後まで読まれた
高解像度X線スキャン、表面再構成、平坦化、機械学習によるインク検出 を組み合わせ、炭化した巻物を読めるページへと変換した
約 1.4mのパピルス とギリシャ語約22欄の下部が復元され、内容は人間の本性・衝動・道徳的進歩を扱う ストア派倫理学の論文 であることが確認された
PHerc. Paris 4 では3D X線データ内のインクが直接見え、PHerc. 139 では Philodemus, On Gods, Book 8 という題名と著者表記が復元された
断層撮影データ、復元表面、転写文、コードが公開され、検証と再現が可能であり、なお封印された数百本のヘルクラネウム巻物にも同じアプローチを適用できる

封印された巻物を開かずに読む

PHerc. 1667 は、Vesuvius Challenge コミュニティで Scroll 4 と呼ばれているヘルクラネウム・パピルスである
紀元79年のヴェスヴィオ噴火以後、およそ2,000年にわたって封印されており、炭化しているため物理的に広げると破壊されるおそれがあった
今回の作業は、巻物のページに直接触れることなく 完全な仮想展開 と連続的な解読を達成した
公開された成果物は、約 1.4m の長さのパピルス表面と、ギリシャ語約22欄のテキストである
preprint PDF、データ、GitHubコードがあわせて公開された

PHerc. 1667 から復元されたテキスト

PHerc. 1667 はもともとさらに大きな巻物だったが、19世紀、1969年、1980年代の手作業による開封の試みで外層が破壊された
残された部分は、元の高さ19–24cmのうち約 8cm に相当する、密に詰まった内部コアである
研究チームは保存された部分から約22欄の下部を復元し、パピルス学者たちがそれを転写・検討した
今回の結果は、単語や断片ではなく、保存されたテキストを 最初から最後まで連続的に 読んだ初の事例である

内容と学術的同定

復元されたテキストは 倫理学の哲学論文 である
人間の本性、衝動、人間の道徳的進歩を扱う主題と言語的特徴、そして最後に保存された欄に現れる Aristocreon の名が同定の根拠となった
Aristocreon はストア派哲学者 Chrysippus の甥であり弟子とされ、この点がテキストをストア派の文脈および紀元前2世紀に結びつけている
パピルスの損傷で表面が失われた箇所には空白が残っており、解読文はなお断片的である
それでも複数の一節が2,000年ぶりに初めて明瞭に読まれた
- 「私たちは何かを探究するだろうが、いかなる仕方であれ私たち自身と私たちの本性から外れてしまえば、それを把握することはできないだろう…」
- 「研究と学びを通じて私たち自身を極限まで緊張させたのち…同じ実践的知恵を備えつつ…」
- 「そのようなものが私たちにとって善であるなら、その反対の悪のうちにも善いものはなく――美しいものはなおさらなく――悪いものもなく――醜いものはなおさらなく――幸福もないだろう…」

他の巻物で得られた検証と同定

PHerc. Paris 4 は、Vesuvius Challenge コミュニティで Scroll 1 と呼ばれている巻物である
より高解像度の画像化手法によって、インクが3次元X線データ内で 直接見える 結果が初めて得られた
3Dで分割されたインクを展開されたページに再投影すると、2023 Grand Prize で読まれたテキストと 一対一で一致 した
これは、より良いデータによって既存の解読が実在のものであることを独立に確認した事例である
PHerc. 139 では、題名領域のインク信号を強調することで題名と著者表記を復元した
- 同定された作品は Philodemus, On Gods, Book 8
- 閉じた巻物の題名が読めれば、本文の欄を研究する前でも何の作品かが分かる

用いられた技術と公開方法

スキャンはグルノーブルの European Synchrotron Radiation Facility BM18ビームラインで、高解像度位相コントラストX線マイクロトモグラフィー により取得された
この装置により、ヘルクラネウム巻物の薄く密に積み重なった層を分解して観察できる
作業は、ヘルクラネウム・パピルスを所蔵する National Library of Naples “Vittorio Emanuele III” と協力して行われた
処理工程は4段階で構成される
- 巻物内部の 幾何構造 を再構成する
- 表面を追跡して、読めるシートへと平坦化する
- 炭化したパピルスとほとんど区別できないインクを検出するよう機械学習モデルを学習させる
- 各解読結果をパピルス学者たちが検討し、転写する
断層撮影データ、再構成表面、転写文は Creative Commons ライセンスで scrollprize.org/data に公開され、ESRF に保管される
コードは GitHub で公開されており、検証や他の巻物への適用が可能である

オープンサイエンスと次の段階

ヘルクラネウム巻物の仮想展開は、EduceLab の Brent Seales 教授が先駆した
2023年、Seales は自身の研究室の画像・ソフトウェア技術を Vesuvius Challenge に公開した
Vesuvius Challenge は、Brent Seales、Nat Friedman、Daniel Gross が共同創設した公開・寄付ベースのプロジェクトである
first letters と 2023 Grand Prize は世界中の参加者が獲得した
現在の Vesuvius Challenge 研究チームの多くは、当初は参加者として加わり、公開競争の中でブレークスルーを生み出して受賞した後、研究チームに加わった
なお封印されたヘルクラネウム巻物は数百本残っており、哲学・詩・散文から成る図書館全体が、古代以来初めて読まれるのを待っている
参加への道は開かれている
- preprint PDF で科学的内容を確認する
- scrollprize.org/data と GitHub でデータとコードを入手する
- get started でコミュニティ参加を始める

1件のコメント

GN⁺ 17 시간 전

Hacker News のコメント

紀元前200年ごろ、Aristocreon が巻物に考えを書きつけていた場面を想像してしまう。
その巻物がしばらく図書館に保管されるかもしれない、くらいは分かっていただろうが、300年後に火山が巻物を破壊しつつも何らかの形で保存し、ほぼ2千年後に砂と稲妻の遠い親戚のような材料で作られた機械を持つ未来の人類が再び読み取り、全地球へ即座に送信することになるとは想像もできなかったはず。
当時は地球が球形であることが比較的最近証明されたばかりだったが、世界の多くはまだ未知だった。いまの私たちは、より優れた想像力を持っているのだろうか？ SF作家たちは、現在の私たちの知識からそれほど途方もなく遠い何かを想像できるのだろうか？
- 真っ先に思い浮かんだのは、近い将来に量子コンピューティングで破られる可能性を見越して暗号化データを収集している人たちだ。
- 人間そのものは大きく変わっていないので、想像力が知識の影響を受けるなら今のほうが優れているかもしれないし、固定された能力ならそうではないかもしれない。
  現代人の視力がその時代と違うわけではないが、今ではほぼ誰もが文字を読める一方、当時はこうした巻物を読める人はごくわずかだった。SFは十分に目眩がするほど異質な未来を作り出している。Greg Egan の Orthogonal シリーズのように、空間3次元と時間1次元の配置が異なる宇宙を扱うハードSFもあるし、もっと普通に人間社会の延長線上にある未来なら、Vinge の Rainbows End から Stross の遠未来ものまで数多い。
- わざわざ紀元前200年までさかのぼる必要もない。1700年ごろでさえ、この話を想像するのは難しかったはずだ。
  1800年代なら、少なくとも「電気」の部分は理解できたかもしれない。
- それに匹敵するような想像はできない気がする。現実はいつだって小説より奇妙だからだ。
- Jacquard 織機が最初のプログラムを走らせて以降、ほとんど別の惑星のようになった。
  もしかすると、印刷機が最初の印刷を行った時点から、すでにそうだったのかもしれない。
Vesuvius Challenge チームで分割、展開、インク検出を担当していた。質問があれば答えられる。
- 今どれほどすごい気分なのか気になる。長いあいだ読めなかった巻物を、断片ごとに読めるようにする機械を発明したというのは、とんでもないことだ。
  2千年以上前の壊れやすい巻物を実際には開かずに読む機械を作り、その仕事に直接貢献したという点が驚きだ。
- モデルがインクとパピルスを区別するとき、どんな特徴を捉えているのか気になる。
  人間の専門家がインクを示した画像や、内容が既知の炭化巻物のスキャンのようなラベル付きデータがあったのかも気になる。私の目では、この作業でランダムな推測よりうまくできる自信はないし、そもそも3次元データのうち2次元断面しか見られないという制約も大きい。
- チャレンジには参加したが、あまり先へは進めなかった。当時気になっていたのは、機械学習でインクを検出すると幻覚文字や本文の一部を作り出してしまうのではないか、そしてそれをどう防げるのか、ということだった。
- チーム全体に大きな賛辞を送りたい。巻物について初めて聞いてから30年間この発表を待っていたし、本当に素晴らしい成果だ。
- 処理速度がどの程度なのか気になる。
  本を開いてスキャンするより、閉じたままスキャンするほうが速くなるほど自動化できるのだろうか？
Herculaneum 遺跡はまだ約20%しか発掘されていないため、さらに多くの巻物が存在する可能性が高い。
現在の巻物は当時の主要な図書館ではなく、私的なコレクションに近いものだった。この技術で読めるようになった今、さまざまなテーマの巻物が何千本も収められた完全な図書館を発見する場面は、本当に胸躍るものになるだろう。
- これは最終的に、私たちの古代世界の理解のしかたを完全に変える可能性がある。
  現在まで伝わっている古代ギリシャ語・ラテン語の著作は全体の約1%にすぎないと推定されており、Punic のような他の言語はさらに少ない [0]。作品や著者の中には、後世の文献で名前だけが引用されているために知られているものもある。
  さらに、生き残ったテキストは中世に高価な動物の皮の上へ修道士たちが繰り返し写本したから残ったのであり、その過程では当然、彼らにとってより興味深い主題が優先された。文字どおり、すべてが変わり得る。
  [0] https://talesoftimesforgotten.com/2021/09/25/are-there-more-...
テック業界の状況に気が滅入り、賢い人たちが人々の喉元により多くの広告を押し込む仕事にかかりきりだと思えてくるたびに、こういうプロジェクトも存在することを思い出せばいい。
ものすごい仕事をしている賢い人たちもたくさんいて、ただ彼らはあまり騒がしくないだけだ。
- こういうことだけがすごいわけではない。AIは医学分野の発見にも使われているし、敗血症をより早く検知して死亡を減らすことにも使われている。
  また、Alzheimer 遺伝子が単なる徴候ではなく発症を活性化するという点を見つけた例もあった。
2千年後の並行例はこんな感じなのだろうか：「2484年の大太陽フレア後の Step Brothers DVD が解読される」
- 私たちは、長期間失われていた Chekhov の「The Three Sisters」の結末を口承で再現したものと思われる視聴覚メディアの復元に成功した。どうやら照明は点いていたらしい。
- 誰かがDeCSS コードの書かれた化石化したTシャツを発見しているはずだ。
- 私の理解では、Pompeii は基本的に享楽と快楽の都市だった。
  これまで出てきた巻物のテキストも、だいたい古代版ポルノ・ファンフィクションのように見える。結局、人間の暮らしはあまり変わらない。
今AIで行われていることの中で、これは最も興味深い部類に入る。医療研究と並んでそうだ。
古代世界にかなり執着しているほうなので、約2千年前の新しいテキストをページ単位で読めるようになることを夢見てきた。
こうした翻訳を読むたびに、いつも語調まで翻訳されているのかが気になる
原文の筆者は、とても改まった “to the utmost” を意図していたのか、それとももっと軽い “to the max” だったのか。翻訳者のバイアスが、こういう文章をソーシャルメディアの投稿ではなく学術論文のように見せてしまう割合はどれほどなのだろう？
- 役に立つ古代テキストの翻訳には、たいてい原文も併載されていて、読者が翻訳の忠実度を判断できるようになっている
  古代テキストを読みたいなら、“Loeb library” のような対訳版がある。原文を省いた翻訳は、内容を大まかに知りたいだけで、翻訳の正確さにはあまり関心がない人向けのものだ
  対訳版があれば、原語の知識が比較的少なくても原文を理解しやすくなる。原文が重要なのは、目標言語に正確な等価語がなく、翻訳者がやむを得ず不正確さを混ぜ込むことが多いからだ
  特に、異なる古代語の単語を同じ英単語に訳すとニュアンスが消えて誤解を招く。逆に、同じ古代語の単語を文脈に応じて別々の英単語に訳す場合も混乱を招く
  単語の意味は文脈によって変わり得るが、翻訳者がその科学・技術的文脈について十分な専門知識を持っていなければ、読者より良い判断ができないこともある。より良い翻訳者は単語間の一対一対応を好み、読者が複数の用例を見て古代の筆者の意図を自分で探りやすくしてくれる
- だから直訳や語源を掘り下げることが好きで、当時の生活を成り立たせていた活動が何だったのかも一緒に問うようにしている
  有能な弓兵になる必要はないが、特定の形の弓を使っていた人を理解するには、その弓に少しでも触れてみるほうが楽だ
- 哲学テキストなら、おそらく非常に密度の高い散文である可能性が高い
  格式あるギリシャ語・ラテン語の文章は、従属節が大量についた長い文を好んだ。今では学界や「高尚な」文学の外では、人々はそんな書き方をあまりしない。気軽な手紙や落書きは、ツイートにもっと近かったはずだ
- 古典詩人 Somewhat Frosty の古代の名詩 Mugger's Paradise を訳すとこうなる:
  死の影さす谷を歩みながら、
  私はわが人生を熟考し、残されたものがないことを悟る。
  私は長きにわたり武器を振るい、笑ってきたがゆえに、
  わが母にさえ、私の精神は去ってしまったように見える。
  しかし私は、欺かれるに値する者のほかは誰も欺かなかったのだから、
  私が臆病者と見なされるなど、まことに聞いたことがない。
  何を語るか、どこへ進むかに気をつけよ。
  汝と汝の仲間たちが白墨の線で囲まれぬように
- 手がかりが非常に少ない場合もあるが、共和政末期からローマ帝国初期については、実際には参照できるものが多い
  ラテン語は非常に豊かな言語であり、これは短い断片でもない。翻訳は常に難しく、特に数千年前のテキストはなおさら難しいが、この種の翻訳はかなり高い確信を持って行える
この文章を書いた人は、ピラミッドを造った技術よりも、自分のテキストの焦げた断片を解読した技術のほうに、時間的には近かった
考えてみるとかなり奇妙だ
- 「ピラミッドを造った技術」というなら、ロープと荷車のことを言っているのか？
いつか破壊せずに読める技術が生まれるという希望のもとで、それほど長く保存していたというのは、人間の能力と楽観主義に対する驚くべき試練のように感じる
こういう話は未来への希望を大いに与えてくれる
「どのような形であれ、私たち自身と私たちの本性から離れるなら、私たちは何かを探求するだろうが、それをつかむことはできないだろう……」という文を私たちが見つけ出したことは、美しく皮肉だ

ヘルクラネウム巻物全体の解読に初めて成功

封印された巻物を開かずに読む

PHerc. 1667 から復元されたテキスト

内容と学術的同定

他の巻物で得られた検証と同定

用いられた技術と公開方法

オープンサイエンスと次の段階

関連記事

1件のコメント

Hacker News のコメント