1 ポイント 投稿者 GN⁺ 3 시간 전 | 1件のコメント | WhatsAppで共有
  • Project Gutenberg は75,000冊以上の無料eBookを提供しており、epub・Kindleダウンロードとオンライン閲覧に対応
  • 書籍は世界の主要な文学作品が中心で、特に 米国で著作権が消滅した古い作品 に重点を置く
  • 利用は 100%無料 で、料金・登録・専用アプリなしでWebブラウザやeBookリーダーからアクセス可能
  • 1971年から無料eBookを切り開いてきた 50年以上 のプロジェクトで、数百人のボランティアがデジタル化と校正に貢献
  • 著者・タイトル・主題・言語・形式・人気順での検索に対応し、Distributed Proofreaders の校正やLibriVoxの録音参加も可能

無料eBookを探す

  • Frequently Downloaded: 最も多くダウンロードされた上位100冊を見られる
  • 人気順検索: ダウンロード数順に並んだ書籍一覧を提供
  • Main Categories: 大手書店で見られるような主要カテゴリを提供
  • Reading Lists: ボランティアが選んだ読書リストを提供
  • Search Options: 著者、タイトル、主題、言語、形式、人気などで検索可能
  • self.gutenberg.org: World Library Foundation の セルフパブリッシングeBook を提供

利用条件とプロジェクトの性格

  • Project Gutenberg のeBookは 100%無料 で、料金や登録は不要
  • 別途アプリは不要で、一般的なWebブラウザやeBookリーダーがあれば利用可能
  • 世界の主要な文学作品を提供し、特に 米国で著作権が消滅した古い作品 に重点を置く
  • Project Gutenberg は 1971年から 無料eBookを切り開いてきた 50年以上 のプロジェクト
  • 数百人の ボランティア が長年にわたりeBookのデジタル化と校正に貢献してきた
  • より多くの本をデジタル化するために使われる 寄付 も受け付けている

参加方法

  • Distributed Proofreaders は新しいボランティアを募集しており、Project Gutenberg の新規eBookの主要な供給源となっている
  • 1日1ページの校正だけでもプロジェクトの助けになりうる
  • Fix and improve からエラー、バグ、誤字を報告し、変更を提案できる
  • LibriVox とともにオーディオブック録音に参加できる

オーディオブック

  • オーディオブックは文学を楽しむもう一つの方法であり、紹介されている資料はすべて Project Gutenberg テキストのデジタル化版
  • これらのオーディオブックは無料で利用でき、米国では パブリックドメイン
  • Project Gutenberg’s 662 titles read by people: 人が朗読した662作品を提供
  • Human-read audio books from LibriVox: LibriVox のボランティアコミュニティが制作した朗読オーディオブックを提供
  • The Project Gutenberg Open Audiobook Collection: Project Gutenberg が Microsoft および MIT と協力して2023年に公開した、約5,000件のコンピュータ生成タイトルを含む
  • Project Gutenberg’s audio books from 2003: 2003年のコンピュータ生成オーディオブックで、聴くことはできるが現在の技術と比べると品質は低い

1件のコメント

 
GN⁺ 3 시간 전
Hacker Newsの反応
  • Gutenberg のプログラマーの一人です。この数か月でサイトをかなり改善してきましたし、今後もさらに変わっていく予定です
    最近見ていないなら、もう一度確認してみる価値があります: https://www.gutenberg.org/

    • 各書籍、つまり各電子テキストごとに詳細な版履歴があるとよいかもしれません。誤植修正の提出はメール方式ですが(https://www.gutenberg.org/help/errata.html)、2011年にやってみたときは修正自体は数日で反映されたものの、プロセスはかなり不透明に感じられました
      版履歴には、その電子テキストがどこから来たのか、通常は PGDP のようなプロジェクト情報も含められると、実際のページスキャンと照合できるはずです。Standard Ebooks については複雑な思いがありますし、Project Gutenberg を直接使うほうを好みますが、Standard Ebooks には本ごとに GitHub のgit リポジトリがあり、時間経過に伴う修正履歴を原理的に確認できる利点があります
    • Project Gutenberg というと、元々の無骨なブルータリズム的ノーデザインを思い出しますが、現在のサイトはとてもセンスよく更新されていて、スタイルを無効にしてもアクセシビリティは依然として高そうです
    • 興味深いことに、TCP ハンドシェイクに 4.5 秒、TLS ハンドシェイクにさらに 9.2 秒かかりました。大半のボットはその前に切断するでしょうし、一度完了すれば正規ユーザーとみなす一種の CAPTCHA なのか気になります
      ボットが追いつくまでは比較的煩わしくなく、Chrome/Chromium ではない珍しいクライアントソフトウェアを差別しない方式かもしれません。残りのリクエストは非常に高速でした
    • モバイルでは、トップページの書籍一覧要素が横方向にも縦方向にもスクロール可能な div としてレンダリングされます。改善の余地がありそうです
    • 古い本が多いので、検索機能に出版日または日付範囲を追加するとよいと思います。調べ物をするとき、特定の年 x より古い資料を探すことが多いので、個人的にはかなり便利そうです
  • Project Gutenberg は 1990 年代以降、インターネットの成長と普及で広く使われ大きくなったのでしょうが、実際の始まりは1971年だったと知りました
    Michael S. Hart がアメリカ独立宣言をデジタル化したことから始まり、イリノイ大学の学生だった Hart は材料研究所の Xerox Sigma V メインフレームへのアクセス権を得ていました。このコンピュータは後にインターネットとなる ARPANET の 15 ノードの一つで、Hart はいつか大衆がコンピュータにアクセスできるようになると見て、文学作品を電子形式で無料提供することにしたそうです
    https://en.wikipedia.org/wiki/Project_Gutenberg

    • 「Project Gutenberg は 1971 年、Michael Hart がイリノイ大学材料研究所の Xerox Sigma V メインフレーム運用者から1億ドル分のコンピュータ時間が入った運用者アカウントを受け取ったことで始まった」
      https://www.gutenberg.org/about/background/history_and_philo...
    • Wikipedia の編集者がこの記事を更新してくれるといいのですが
  • 父に Kindle とアクセスポイントを買ってあげて、Project Gutenberg から本を入手する方法を教えたのは、自分がしてあげたことの中でも最高の一つでした
    父は朝鮮戦争に従軍した海軍出身で GED 保持者でしたが、Harvard Classics 全巻を読むほど古典を愛していました。お気に入りの椅子に座り、膝の上の Kindle を支えるために丸めたタオルを使って、ひたすら読み続けていました。亡くなったときには 1931 年版の "Legends of the Jews" を読んでいました
    90 年代には Michael S. Hart と短くメールをやり取りしたことがあり、プロジェクトにも少し貢献しましたが、英文学専攻の学部生だった自分にとって大きな誇りと喜びでした。そういう理由で Project Gutenberg は自分にとって特別で、今も健在なのを見るとうれしいです

    • 実際の転写を担っているDistributed Proofreadersは今もボランティアを募集しています。心が動いたら参加できます
      https://www.pgdp.net
  • 電子書籍リーダー会社の中で、Project Gutenberg の「ストア」を組み込んだところがないのは驚きです。Gutenberg を閲覧して本を探し、そのままリーダーにダウンロードできればよいのに、実際には Kindle のように積極的に非友好的だったり、Calibre を使う必要があったりと摩擦があります

    • ブラウザをサポートする電子書籍リーダーでは、https://standardebooks.org/ から整理の行き届いた Project Gutenberg 本をダウンロードして読んできました。自分の場合は Boox でした
      技術的には Project Gutenberg から epub を直接取ることもできますが、体裁がいまひとつな場合が多いです。ある程度まともな OS、たとえば古くても素の Android が動く電子書籍リーダーを使うようになると、Kindle のような機器には戻りづらくなります
    • Project Gutenberg ライセンスを書籍テキストから削除せずそのまま残す場合、つまり誰も争わないパブリックドメイン本文だけにしない場合、Project Gutenberg-tm 著作物の利用から得た総利益の 20% を通常の税務計算方式に従って算定し、ロイヤルティとして支払う必要があります
      https://www.gutenberg.org/policy/license.html
      iPhone 初期に "Eucalyptus" という Project Gutenberg テキストベースの読書アプリを販売し、総利益の 20% を PG に送っていました。PG はそのアプリをずっととても支援してくれていて、そうするのは気分のよいことでした
    • たいていは自前の有料ストアを運営しているので、無料の本が多い領域を提供しないという歪んだインセンティブがあります
    • 以前は Project Librivox の https://librivox.org/ と電子書籍アプリ Gutebooks である程度それが可能でした。音声アプリもありましたが、今は廃止されたようで、自分のコピーではもうサーバーにつながりません
      Barnes & Noble はフィリピンの書籍組版・入力業者を使って、パブリックドメイン作品を掘り起こすようにして自社ストアに載せていますし、Amazon も Kindle Store に似た構成があるようです: https://www.amazon.com/Public-Domain-Books-Kindle-Store/s?k=...
      PG が先手を打ってそこに本を載せて収益化しなかったのは、かなり惜しいです
    • 最新の Kobo 電子書籍リーダーには、gutenberg.org にアクセスしてファイルを直接ダウンロードできるブラウザがあると聞きました
      それでも全体としては同意です。7万5000冊の図書館に直接アクセスできるのは、かなり価値がありそうです
  • イタリアでは https://www.gutenberg.org/ が 404 を返し、https://gutenberg.org/ は「police notice. This site is under judicial seizure」と書かれた非常に公式なページを開き、「criminal proceedings 52127/20 R.N.R.I. tribunal of Rome」という事件番号を表示します
    何が起きているのかわかりません。PG はパブリックドメインの本を公開しているのだと思っていました

    • 調べてみると 2020 年の判決で、PG は控訴しないことにしたそうです
      全体の話はイタリア語で https://www.wired.it/internet/web/2020/06/30/progetto-gutenb... にあります
    • ドイツでも、しばらくの間、裁判所命令でブロックされていたことがありました: https://cand.pglaf.org/germany/index.html
    • Claude に背景を調べてもらったところ、2020 年 5 月にローマの裁判所が、海賊版の新聞・雑誌を配布していたサイトや Telegram チャンネルを対象とする刑事事件の一環として、イタリアの ISP に対しドメイン一覧の差し押さえ・遮断を命じ、その 28 ドメインの一覧に Project Gutenberg が実際の海賊サイトと一緒に含まれていたとのことでした
      この状況はまだ解決していないようです
  • 私たちのしていることにこれほど多くの好意が示されていて、うれしいです。私は比較的新しく来た専務理事です
    Wikipedia の編集者が見ているなら、PG の記事はかなり古いです。最後に見たときにはまだ Plucker ファイルを提供していることになっていて、@Jseiko がよい仕事をしてくれました

  • Project Gutenberg は宝の山ですが、自動組版を難しくする技術的な細部が多くあります。Standard Ebooks は一貫性を信じがたいほど高めています
    パブリックドメイン本の複数ソースを組版の観点から比較した文章を書きました: https://dave.autonoma.ca/blog/2020/04/11/project-gutenberg-p...

  • Project Gutenberg ZIM も言及に値します。英語の Gutenberg コーパス全体を約 60GB で入手できます
    参考までに、画像込みの英語版 Wikipedia ZIM 全体は約 120GB です: https://ebookfoundation.org/openzim.html

  • Project Gutenberg は以前からプレーンテキスト志向が強く、ずっと少し敬遠していました。ちゃんとサイトを見たのは 10 年以上前なので、今では自分が間違っている可能性が高いです
    自分はスタイルの効いた本が好きで、PDF を好みます。Project Gutenberg の趣旨は素晴らしいですが、archive.org の書籍スキャンのほうが好みでした。代表例として Lewis Carroll の "Through the Looking Glass" には John Tenniel のすばらしい挿絵と、Carroll 特有の創造的な散文レイアウトがあります
    今では Project Gutenberg にも ePub があるようですが、うまく作られていればよいものになりえます。うまく作られていないと、リフローする「HTML」と改ページが入り混じった混沌になりかねず、長いウェブページを印刷したことがある人ならどんな結果になるかわかるはずです。もちろん、それは ePub リーダー側の問題かもしれません

    • ほとんどの本でEPUB3をサポートしています。同時に各書籍ごとに「Plain Text」版も用意しています。ある意味ではそれが最も堅牢な形式だからです。PDF も進行中です
    • ここで他の人たちも述べているように、https://standardebooks.org/ はすばらしいです。自分の理解では、Gutenberg の本を元にしつつ、はるかによく磨き上げたものを提供しています
    • Project Gutenberg のHTML 版をブックマークしておき、ログインなしで複数デバイス間で続きを読めるのは本当に便利です
      ブラウザ内蔵機能をかなり活用して、フォント、背景、テキスト読み上げ、印刷レイアウト、抜粋の共有など、読書体験を改善しています。PDF、epub やその他の形式ではこうした体験はあまりよくありません。自分は他のどのデジタルプラットフォームよりも PG で意味のあるテキストを多く読んできましたし、すっきりしていて無料のまま保たれている点が気に入っています
    • Standard eBooks を見てみるとよいです。Gutenberg のテキストを取り込み、ePub の完成度を高めてくれます
    • 逆に、自分は小説なら epub のほうが好きです。主にスマホで読んでいます
  • 昨日最も多くダウンロードされた本[0]は、Gillette と Hill のConcrete Construction: Methods and Costsだったようです[1]。Moby Dick、Count of Monte Cristo、Frankenstein、Romeo and Juliet などを上回っていました
    直近 30 日のダウンロード数は 23,644 件とのこと。ボットの挙動なのか気になります。2 万 3 千件はかなり多く感じます
    [0] https://www.gutenberg.org/browse/scores/top
    [1] https://www.gutenberg.org/ebooks/24855

    • コンクリートに関するスリリングな映画、John Wilson の "The History of Concrete" が公開されるので、熱心なファンが予習しているに違いありません
    • 自分もボットトラフィックの可能性が高いと思います。「Concrete Construction Methods」への世界的関心が突然急増したとは考えにくいです
    • Goodreads の評価も Moby Dick より高いです。次に読む本が決まったようです