元のWWW提案書ファイルを開く試み
- W3CのWebサイトには、ティム・バーナーズ=リー(Tim Berners-Lee)が作成した元のWWW提案書がある。
- 提案書の元ファイルはWord for Macintosh 4.0用のファイルで、1990年に作成されたとみられる。
- 元文書は68,608バイトで、Macでファイルタイプを確認した結果、Microsoft Word for Macintosh 4.0ファイルと表示された。
さまざまなソフトウェアで開く試み
- Microsoft Word: 元ファイルをOneDriveにアップロードし、
.doc拡張子を付けてMicrosoft Wordで開いてみた。
- Apple Pages: 古いMicrosoft Word for Macintoshファイルを認識できなかった。
- Apache OpenOffice: ファイルは開けるが、書式が失われ、図も欠落する。
- LibreOffice: ファイルを開けて図も鮮明に表示されるが、余白やそのほかの書式に問題がある。
CERNのPDFとLibreOfficeで生成したPDFの比較
- CERNが提供するPDFは1998年に生成されたもので、20ページ構成である。
- LibreOfficeで取り込んだ版は24ページである。
- 2つのPDFを比較すると、余白、フォントサイズ、ヘッダーとフッター、改ページなどに違いがある。
エミュレーションによる元文書の確認
- 1990年代のMacintoshをエミュレートし、実際のWord for Macintosh 4.0を動かして元文書の見た目を確認した。
- 元文書とCERNのPDFはかなり異なっており、元文書はA4用紙で22ページだった。
結論
- 元文書を現代のソフトウェアで変換できることは、オープンソースソフトウェアの勝利であると同時に、文書保存の難しさを示している。
- 文書を保存するため、
.odt版をGitHubにアップロードした。
- 34年前の文書が今なお開きにくく、開けても元の状態と正確に同じではないという事実は、やや失望させられる。
GN⁺の意見
- このブログ記事は、元のWWW提案書文書のデジタル保存とアクセシビリティの重要性を強調している。
- オープンソースソフトウェアが古い文書形式を扱ううえで、どれほど重要な役割を果たすかを示している。
- 文書保存の難しさを理解し、技術の進歩に合わせて互換性と長期的なアクセス性を考慮することの重要性を認識するきっかけになる。
1件のコメント
Hacker Newsのコメント
現代のWord形式に変換された文書の共有
フォントとレイアウトの確認
fileコマンドの有用性fileコマンドは、ファイルに関する疑問を解消し、有用な情報を提供するのに非常に役立つ。LibreOfficeの優れた旧式文書ファイル形式サポート
Microsoft Wordの後方互換性
LibreOfficeの驚くべき機能
エミュレーターでの文書印刷
Microsoft Wordの文書互換性に対する失望
無期限保存バックアップの潜在的問題
旧型MacとWordの利用