10 ポイント 投稿者 GN⁺ 2023-09-12 | 1件のコメント | WhatsAppで共有
  • プロジェクト・グーテンベルクとマイクロソフトが、数千点の無料オーディオブックを提供する公開コレクションの作成で協力
  • 新しいニューラルネットワークのテキスト読み上げ技術と、プロジェクト・グーテンベルクの広範な公開アクセス電子書籍コレクションを利用してオーディオブックを生成
  • このプロジェクトは、高品質なオーディオブックへのアクセスを拡大し、すべての(オーディオ)ブック愛好家に文学へのアクセスを提供することを目指している
  • これらのオーディオブックの生成に使用された技術は、「Large Scale Intelligent Microservices」という題名のIEEE Big Data論文で詳しく説明されている
  • プロジェクト・グーテンベルクコレクションの電子書籍を自動解析してオーディオブックを生成
  • 一部のオーディオブックには、誤り、不自然な発音、攻撃的な言葉遣い、またはすべての読者に適さない内容が含まれる場合がある
  • これらのオーディオブックで提示される言語や見解は、マイクロソフトまたはプロジェクト・グーテンベルクの見解を代表するものではない
  • 録音に問題がある場合は https://aka.ms/audiobook-issues から報告可能

1件のコメント

 
GN⁺ 2023-09-12
Hacker Newsの意見
  • プロジェクト・グーテンベルクのオープンオーディオブックコレクションは、テキストをオーディオブックに変換するAIを使用する新しいプロジェクトです。
  • 一部のユーザーはAIの朗読に不満を示しており、音声が平板で、人間の読み手が持つ感情的な深みがないと指摘しました。
  • AIによる句読点の解釈に問題があり、朗読中に不自然な区切れが発生するという問題があります。
  • 一部のユーザーは、グーテンベルクのコンテンツからオーディオブックを作るために、高品質な声優のための資金を集めるプロジェクトを提案しました。
  • あるユーザーはLibrivoxを勧めました。これは人間が読んだパブリックドメインのオーディオブック向けプラットフォームです。
  • 別のユーザーは、オーディオブックを整理・管理するデスクトップアプリであるAudiobook Lockerを勧めました。
  • ユーザーたちはまた、Escape Artists、Drabblecast、Lightspeed Magazine、そしてAsimov'sのような音声フィクションのポッドキャストをチェックしてみることを提案しました。
  • 一部のユーザーは、AIの朗読で名前の発音を間違えたり、数字を誤って解釈したりするなどのエラーを指摘しました。
  • 批判はあるものの、一部のユーザーは、AIの朗読のほうがLibrivoxの一部の人間による録音より優れていると感じました。
  • あるユーザーは、最も人気のあるグーテンベルクコレクションの本のテキストを現代化し、簡略化するためにchatGPTを使うことを提案しました。
  • 一部のユーザーは、AIの朗読で本のタイトルの発音を間違えるなど、音声読み上げの誤りを指摘しました。
  • あるユーザーは、図書館でオーディオブックを借りるためのアプリ「Libby」を勧めました。