Project Gutenberg - さらに良くなり続けている
(gutenberg.org)- Project Gutenberg は75,000冊以上の無料eBookを提供しており、epub・Kindleダウンロードとオンライン閲覧に対応
- 書籍は世界の主要な文学作品が中心で、特に 米国で著作権が消滅した古い作品 に重点を置く
- 利用は 100%無料 で、料金・登録・専用アプリなしでWebブラウザやeBookリーダーからアクセス可能
- 1971年から無料eBookを切り開いてきた 50年以上 のプロジェクトで、数百人のボランティアがデジタル化と校正に貢献
- 著者・タイトル・主題・言語・形式・人気順での検索に対応し、Distributed Proofreaders の校正やLibriVoxの録音参加も可能
無料eBookを探す
- Frequently Downloaded: 最も多くダウンロードされた上位100冊を見られる
- 人気順検索: ダウンロード数順に並んだ書籍一覧を提供
- Main Categories: 大手書店で見られるような主要カテゴリを提供
- Reading Lists: ボランティアが選んだ読書リストを提供
- Search Options: 著者、タイトル、主題、言語、形式、人気などで検索可能
- self.gutenberg.org: World Library Foundation の セルフパブリッシングeBook を提供
利用条件とプロジェクトの性格
- Project Gutenberg のeBookは 100%無料 で、料金や登録は不要
- 別途アプリは不要で、一般的なWebブラウザやeBookリーダーがあれば利用可能
- 世界の主要な文学作品を提供し、特に 米国で著作権が消滅した古い作品 に重点を置く
- Project Gutenberg は 1971年から 無料eBookを切り開いてきた 50年以上 のプロジェクト
- 数百人の ボランティア が長年にわたりeBookのデジタル化と校正に貢献してきた
- より多くの本をデジタル化するために使われる 寄付 も受け付けている
参加方法
- Distributed Proofreaders は新しいボランティアを募集しており、Project Gutenberg の新規eBookの主要な供給源となっている
- 1日1ページの校正だけでもプロジェクトの助けになりうる
- Fix and improve からエラー、バグ、誤字を報告し、変更を提案できる
- LibriVox とともにオーディオブック録音に参加できる
オーディオブック
- オーディオブックは文学を楽しむもう一つの方法であり、紹介されている資料はすべて Project Gutenberg テキストのデジタル化版
- これらのオーディオブックは無料で利用でき、米国では パブリックドメイン
- Project Gutenberg’s 662 titles read by people: 人が朗読した662作品を提供
- Human-read audio books from LibriVox: LibriVox のボランティアコミュニティが制作した朗読オーディオブックを提供
- The Project Gutenberg Open Audiobook Collection: Project Gutenberg が Microsoft および MIT と協力して2023年に公開した、約5,000件のコンピュータ生成タイトルを含む
- Project Gutenberg’s audio books from 2003: 2003年のコンピュータ生成オーディオブックで、聴くことはできるが現在の技術と比べると品質は低い
1件のコメント
Hacker Newsの反応
Gutenberg のプログラマーの一人です。この数か月でサイトをかなり改善してきましたし、今後もさらに変わっていく予定です
最近見ていないなら、もう一度確認してみる価値があります: https://www.gutenberg.org/
版履歴には、その電子テキストがどこから来たのか、通常は PGDP のようなプロジェクト情報も含められると、実際のページスキャンと照合できるはずです。Standard Ebooks については複雑な思いがありますし、Project Gutenberg を直接使うほうを好みますが、Standard Ebooks には本ごとに GitHub のgit リポジトリがあり、時間経過に伴う修正履歴を原理的に確認できる利点があります
ボットが追いつくまでは比較的煩わしくなく、Chrome/Chromium ではない珍しいクライアントソフトウェアを差別しない方式かもしれません。残りのリクエストは非常に高速でした
divとしてレンダリングされます。改善の余地がありそうですProject Gutenberg は 1990 年代以降、インターネットの成長と普及で広く使われ大きくなったのでしょうが、実際の始まりは1971年だったと知りました
Michael S. Hart がアメリカ独立宣言をデジタル化したことから始まり、イリノイ大学の学生だった Hart は材料研究所の Xerox Sigma V メインフレームへのアクセス権を得ていました。このコンピュータは後にインターネットとなる ARPANET の 15 ノードの一つで、Hart はいつか大衆がコンピュータにアクセスできるようになると見て、文学作品を電子形式で無料提供することにしたそうです
https://en.wikipedia.org/wiki/Project_Gutenberg
https://www.gutenberg.org/about/background/history_and_philo...
父に Kindle とアクセスポイントを買ってあげて、Project Gutenberg から本を入手する方法を教えたのは、自分がしてあげたことの中でも最高の一つでした
父は朝鮮戦争に従軍した海軍出身で GED 保持者でしたが、Harvard Classics 全巻を読むほど古典を愛していました。お気に入りの椅子に座り、膝の上の Kindle を支えるために丸めたタオルを使って、ひたすら読み続けていました。亡くなったときには 1931 年版の "Legends of the Jews" を読んでいました
90 年代には Michael S. Hart と短くメールをやり取りしたことがあり、プロジェクトにも少し貢献しましたが、英文学専攻の学部生だった自分にとって大きな誇りと喜びでした。そういう理由で Project Gutenberg は自分にとって特別で、今も健在なのを見るとうれしいです
https://www.pgdp.net
電子書籍リーダー会社の中で、Project Gutenberg の「ストア」を組み込んだところがないのは驚きです。Gutenberg を閲覧して本を探し、そのままリーダーにダウンロードできればよいのに、実際には Kindle のように積極的に非友好的だったり、Calibre を使う必要があったりと摩擦があります
技術的には Project Gutenberg から epub を直接取ることもできますが、体裁がいまひとつな場合が多いです。ある程度まともな OS、たとえば古くても素の Android が動く電子書籍リーダーを使うようになると、Kindle のような機器には戻りづらくなります
https://www.gutenberg.org/policy/license.html
iPhone 初期に "Eucalyptus" という Project Gutenberg テキストベースの読書アプリを販売し、総利益の 20% を PG に送っていました。PG はそのアプリをずっととても支援してくれていて、そうするのは気分のよいことでした
Barnes & Noble はフィリピンの書籍組版・入力業者を使って、パブリックドメイン作品を掘り起こすようにして自社ストアに載せていますし、Amazon も Kindle Store に似た構成があるようです: https://www.amazon.com/Public-Domain-Books-Kindle-Store/s?k=...
PG が先手を打ってそこに本を載せて収益化しなかったのは、かなり惜しいです
それでも全体としては同意です。7万5000冊の図書館に直接アクセスできるのは、かなり価値がありそうです
イタリアでは https://www.gutenberg.org/ が 404 を返し、https://gutenberg.org/ は「police notice. This site is under judicial seizure」と書かれた非常に公式なページを開き、「criminal proceedings 52127/20 R.N.R.I. tribunal of Rome」という事件番号を表示します
何が起きているのかわかりません。PG はパブリックドメインの本を公開しているのだと思っていました
全体の話はイタリア語で https://www.wired.it/internet/web/2020/06/30/progetto-gutenb... にあります
この状況はまだ解決していないようです
私たちのしていることにこれほど多くの好意が示されていて、うれしいです。私は比較的新しく来た専務理事です
Wikipedia の編集者が見ているなら、PG の記事はかなり古いです。最後に見たときにはまだ Plucker ファイルを提供していることになっていて、@Jseiko がよい仕事をしてくれました
Project Gutenberg は宝の山ですが、自動組版を難しくする技術的な細部が多くあります。Standard Ebooks は一貫性を信じがたいほど高めています
パブリックドメイン本の複数ソースを組版の観点から比較した文章を書きました: https://dave.autonoma.ca/blog/2020/04/11/project-gutenberg-p...
Project Gutenberg ZIM も言及に値します。英語の Gutenberg コーパス全体を約 60GB で入手できます
参考までに、画像込みの英語版 Wikipedia ZIM 全体は約 120GB です: https://ebookfoundation.org/openzim.html
Project Gutenberg は以前からプレーンテキスト志向が強く、ずっと少し敬遠していました。ちゃんとサイトを見たのは 10 年以上前なので、今では自分が間違っている可能性が高いです
自分はスタイルの効いた本が好きで、PDF を好みます。Project Gutenberg の趣旨は素晴らしいですが、archive.org の書籍スキャンのほうが好みでした。代表例として Lewis Carroll の "Through the Looking Glass" には John Tenniel のすばらしい挿絵と、Carroll 特有の創造的な散文レイアウトがあります
今では Project Gutenberg にも ePub があるようですが、うまく作られていればよいものになりえます。うまく作られていないと、リフローする「HTML」と改ページが入り混じった混沌になりかねず、長いウェブページを印刷したことがある人ならどんな結果になるかわかるはずです。もちろん、それは ePub リーダー側の問題かもしれません
ブラウザ内蔵機能をかなり活用して、フォント、背景、テキスト読み上げ、印刷レイアウト、抜粋の共有など、読書体験を改善しています。PDF、epub やその他の形式ではこうした体験はあまりよくありません。自分は他のどのデジタルプラットフォームよりも PG で意味のあるテキストを多く読んできましたし、すっきりしていて無料のまま保たれている点が気に入っています
昨日最も多くダウンロードされた本[0]は、Gillette と Hill のConcrete Construction: Methods and Costsだったようです[1]。Moby Dick、Count of Monte Cristo、Frankenstein、Romeo and Juliet などを上回っていました
直近 30 日のダウンロード数は 23,644 件とのこと。ボットの挙動なのか気になります。2 万 3 千件はかなり多く感じます
[0] https://www.gutenberg.org/browse/scores/top
[1] https://www.gutenberg.org/ebooks/24855