1 ポイント 投稿者 GN⁺ 2024-02-14 | 1件のコメント | WhatsAppで共有

元のWWW提案書ファイルを開く試み

  • W3CのWebサイトには、ティム・バーナーズ=リー(Tim Berners-Lee)が作成した元のWWW提案書がある。
  • 提案書の元ファイルはWord for Macintosh 4.0用のファイルで、1990年に作成されたとみられる。
  • 元文書は68,608バイトで、Macでファイルタイプを確認した結果、Microsoft Word for Macintosh 4.0ファイルと表示された。

さまざまなソフトウェアで開く試み

  • Microsoft Word: 元ファイルをOneDriveにアップロードし、.doc拡張子を付けてMicrosoft Wordで開いてみた。
  • Apple Pages: 古いMicrosoft Word for Macintoshファイルを認識できなかった。
  • Apache OpenOffice: ファイルは開けるが、書式が失われ、図も欠落する。
  • LibreOffice: ファイルを開けて図も鮮明に表示されるが、余白やそのほかの書式に問題がある。

CERNのPDFとLibreOfficeで生成したPDFの比較

  • CERNが提供するPDFは1998年に生成されたもので、20ページ構成である。
  • LibreOfficeで取り込んだ版は24ページである。
  • 2つのPDFを比較すると、余白、フォントサイズ、ヘッダーとフッター、改ページなどに違いがある。

エミュレーションによる元文書の確認

  • 1990年代のMacintoshをエミュレートし、実際のWord for Macintosh 4.0を動かして元文書の見た目を確認した。
  • 元文書とCERNのPDFはかなり異なっており、元文書はA4用紙で22ページだった。

結論

  • 元文書を現代のソフトウェアで変換できることは、オープンソースソフトウェアの勝利であると同時に、文書保存の難しさを示している。
  • 文書を保存するため、.odt版をGitHubにアップロードした。
  • 34年前の文書が今なお開きにくく、開けても元の状態と正確に同じではないという事実は、やや失望させられる。

GN⁺の意見

  • このブログ記事は、元のWWW提案書文書のデジタル保存とアクセシビリティの重要性を強調している。
  • オープンソースソフトウェアが古い文書形式を扱ううえで、どれほど重要な役割を果たすかを示している。
  • 文書保存の難しさを理解し、技術の進歩に合わせて互換性と長期的なアクセス性を考慮することの重要性を認識するきっかけになる。

1件のコメント

 
GN⁺ 2024-02-14
Hacker Newsのコメント
  • 現代のWord形式に変換された文書の共有

    • 現代のWord形式の文書が共有されており、すべてのベクターアートワークとフォントが保持されている。
    • 文書を変換するために、QEMUでエミュレートしたPower Mac上で動作するWord 98を使って最初に開き、再保存した。
    • ただし画像が欠落しており、Wordは画像を表示または印刷するための十分なメモリやディスク容量がないと主張した。
    • 画像を復元するため、Word 98でAcrobatを使ってPDFに印刷した後、Adobe Illustratorを使って各画像を個別のPDFとして抽出した。
    • 元の画像を削除し、FinderでPDFの代替物をドラッグ&ドロップして画像を復元するのは簡単だった。
    • 比較のため、Power MacのWord 98で作成したPDFと、macOS Sonomaで動作する現代のWordで作成したPDFが共有された。
  • フォントとレイアウトの確認

    • 元のフォントがあれば、文書が本来どのように見えるべきか確認できる。
    • Word 4.0は、異なる出力解像度に対応するために画面用とプリンター用で別々のフォントファイルを持っていた。
    • プリンターフォントが欠けている場合は画面フォントを拡大して印刷し、画面フォントが欠けている場合はシステムフォントで代用される。
    • このケースでは有名なPalatinoとCourierフォントが必要だったが、LibreOfficeはPalatino LinotypeがインストールされているにもかかわらずTimes New Romanに置き換えた。
  • fileコマンドの有用性

    • fileコマンドは、ファイルに関する疑問を解消し、有用な情報を提供するのに非常に役立つ。
  • LibreOfficeの優れた旧式文書ファイル形式サポート

    • LibreOfficeは旧式の文書ファイル形式を非常によくサポートしており、そのために使っている。
    • BasiliskIIとInfiniteMacエミュレーターを使うのも楽しい。
  • Microsoft Wordの後方互換性

    • Windows版のWordではファイルがほぼ問題なく開け、レイアウトも記事のPDFと同じである。
    • グラフィックフィルターが欠けていて画像は開けなかったが、Word 2003なら開けるだろうと見込まれている。
  • LibreOfficeの驚くべき機能

    • LibreOfficeはさまざまな文書形式を開けるだけでなく、コマンドラインオプションを通じて自動化作業も実行できる。
  • エミュレーターでの文書印刷

    • Mac 4.0を動かすエミュレーターでは、.ps(Postscript)ファイルを生成できる印刷キューをインストールでき、これをPDFに変換できる。
  • Microsoft Wordの文書互換性に対する失望

    • Microsoftは、どのバージョンのWordで作られた文書であっても開けるようにする責任感を持つべきだという意見。
    • 脆弱性への懸念があるなら、外部プロセス内の隔離されたサンドボックスで実行し、新しいバージョンへ変換する機能を提供すべきだ。
  • 無期限保存バックアップの潜在的問題

    • 一部の企業は無期限保存のバックアップを持っており、これは「読める」ことと「使える」ことの違いを理解していないという問題を引き起こしている。
  • 旧型MacとWordの利用

    • System 7.1のMac SE/30を持っており、Word 5がインストールされている。文書を送ってくれれば、Office 2001へのアップグレードを手伝える。