3 ポイント 投稿者 GN⁺ 2023-12-25 | 1件のコメント | WhatsAppで共有

Storyteller: オーディオブックと電子書籍の自動同期プラットフォーム

  • Storytellerは、オーディオブックと電子書籍を自動的に同期するセルフホスト型プラットフォーム。
  • このプラットフォームは、EPUB 3標準に準拠した電子書籍ファイルを生成し、EPUBメディアオーバーレイをサポートするすべての電子書籍リーダー(ソフトウェアまたはハードウェア)で読むことも、専用のStorytellerモバイルアプリを使うこともできる。
  • Storytellerは完全にセルフホスト可能で、すべての書籍はユーザーのハードウェアに保存され、必要に応じて移動、コピー、バックアップを自由に行える。

GN⁺の意見

  • Storytellerは、ユーザーの読書体験を改善するために、オーディオブックと電子書籍を簡単に同期できるプラットフォームを提供している点で重要。
  • ユーザーが自分のデータを完全に制御できるセルフホスト機能は、プライバシー保護とデータ所有権に関する現代的な関心に合致している。
  • EPUB 3標準への準拠は、ユーザーがさまざまなデバイスやソフトウェアで書籍を読めるようにし、互換性とアクセシビリティの向上に貢献している。

1件のコメント

 
GN⁺ 2023-12-25
Hacker Newsのコメント
  • 過去に似たような電子書籍とオーディオブックのアラインメントツールを作ったことがある。当時はテキストアラインメント方式(機械学習を含む)は計算負荷が高く、長文には不向きだと判断して、テキストを合成し、2つの音声シーケンスを整列させる方式を選んだ。Storyteller はテキストをアラインメントする方式で動いているように見えるが、本を同期するのにどれくらい時間がかかるのか気になる。また、音声版とテキスト版がしばしば大きく異なる場合(例: 音声にはテキストにないイントロがある場合)があるが、Storyteller がこうしたケースをどう処理するのか、手動の音声/テキスト編集が必要なのか、それとも自動で差分を処理するのか知りたい。

    • 過去に似たオーディオブックと電子書籍を整列するツールを作った経験があり、Storyteller がテキストを整列して同期する時間や、音声とテキストの差異をどう処理するのか気にしている。
  • このプロジェクトはとても気に入っている。だが、妻と子どもたちは Kobo の電子書籍リーダーで EPUB を読んでいるので、Kobo で最後に読んだページを Storyteller と同期して、後でオーディオブックから続きを聴けるようになると嬉しい。必要なら Kobo に koreader をインストールすることにも反対はない。koreader は epub3 メディアオーバーレイをサポートしていないが、同期機能はある。

    • Kobo の電子書籍リーダーを使う家族のために、最後に読んだページを Storyteller と同期する機能を望んでおり、そのために koreader の導入も検討している。
  • このプロジェクトは本当に人気を集めている! ここで質問やフィードバックをくださった皆さんに感謝している。この設定を試すために時間を割いてくれる方がいたら、Gitter チャンネルに入って挨拶したり、サポートを求めたり、フィードバックを送ったりしてほしい。

    • プロジェクトへの関心とフィードバックに感謝を示し、ユーザーが Gitter チャンネルでサポートを受けたりフィードバックを送れたりすることを案内している。
  • このアイデアは本当に素晴らしい。通勤中にはオーディオブックを聴き、夜には読むのだが、今は audiobookshelf を使って電子書籍を聴いている。audiobookshelf が EPUB を読めるかどうかの議論にコメントを追加した。

    • 通勤中はオーディオブックを聴き、夜は読むユーザーとして、audiobookshelf を使っており、このサービスが EPUB をサポートできるかに関心を示している。
  • e-ink 電子書籍リーダーと互換性があるのか気になる。Amazon から離れたいが、画面に戻りたくはない。

    • e-ink 電子書籍リーダーとの互換性を気にしており、Amazon の代替を探していることを示している。
  • このプロジェクトについてもっと情報が必要だ。iOS アプリのリンクやスクリーンショット、プロジェクトの機能などに関する情報があるとよい。これは audiobookshelf のような電子書籍/オーディオブックのライブラリなのか、それとも単に同期機能だけなのか気になる。

    • プロジェクトに関する追加情報を求めており、特に iOS アプリ、スクリーンショット、機能などの詳細に関心を示している。
  • このプロジェクトは本当に素晴らしい。AI を使って音声を生成する機能が追加されたらさらに素晴らしくなるだろう。Audible を何度も解約してきたが、高品質のオーディオブックは非常に少なく、著者本人が朗読している作品でさえよくないことがある(たいていはプロのナレーターではない)。優れた AI なら、何時間でも疲れずに同じエネルギー、抑揚、速度で話し続けられるので、驚くべきものになるはずだ。

    • AI を使った音声生成機能の追加がこのプロジェクトをさらに魅力的にすると考えており、高品質なオーディオブック不足の解決策として AI の可能性に言及している。
  • このプロジェクトは興味深い。以前、本の内容をタイムスタンプに合わせて同期し、話された単語を文に分割して LJSPEECH データセットを作る似たようなプロジェクトを進めていた。aeneas を使ったが設定が少し厄介だったものの、ドイツ語のような英語以外の言語でも 80% 以上の精度でマッピングできた。LJSPEECH データセットは良かったが、当時の TTS 技術はまだ準備ができていなかった。XTTS のような新しいモデリング手法を使って、このプロジェクトを復活させる時期が来たのかもしれない。

    • オーディオブックと電子書籍を組み合わせて、ユーザーが好きなナレーターの声を合成し、オーディオブックとして出版されていない本を「出版」できるプロジェクトを作った経験があり、新しい TTS 技術を使ってそのプロジェクトを再開できるか検討している。
  • リンクが含まれていなかった: Storyteller。全体として非常に素晴らしいプロジェクトで、次の段階は同期された電子書籍管理システムを構築することだ。

    • Storyteller プロジェクトへのリンクを共有し、同期された電子書籍管理システムの構築を次の目標として挙げている。
  • 共有してくれてありがとう。WhisperSync 機能は、1日に何度もモードを切り替えられるようにしてくれるため、読書量を大きく増やせるゲームチェンジャーだ。この機能が Amazon/Audible のような独占的で DRM がかかったプラットフォームに限定されず、広く普及してほしい。

    • WhisperSync 機能を高く評価しており、こうした機能が Amazon や Audible のような独占的プラットフォームだけに限定されず、広く使われるようになることを願っている。