7 ポイント 投稿者 leelou2 2025-11-17 | まだコメントはありません。 | WhatsAppで共有

今回リリースされた ElevenLabs Realtime Speech to Text を素早く使う方法

できるだけシンプルに、音声文字起こし機能だけを実装しました 🙏

  1. git clone https://github.com/lee-lou2/ai-note.git
  2. https://elevenlabs.io/app/developers/api-keys で「Speech to Text」にアクセスして API キーを発行
  3. clone したプロジェクトのページで .env.sample を複製し、.env ファイルを作成
  4. ELEVENLABS_API_KEY に作成した ElevenLabs API Key を登録し、BASIC_AUTH_USERNAMEBASIC_AUTH_PASSWORD にはページアクセス時に使用するアカウント情報を登録
  5. パッケージをインストール: pip install -r requirements.txt
  6. 実行: uvicorn main:app --reload --port 8000

そして http://localhost:8000 にアクセスするとすぐに使えます

ElevenLabs Realtime Speech to Text v2 は、確かに高速で精度も高いです
現在は無料ユーザーでも利用できます(今後 ElevenLabs の価格ポリシーが変更される可能性があります)

この GitHub リポジトリは今後も継続して更新する予定です

  • (予定)複数のユーザーが同時に接続して 1 つのドキュメントを更新する機能
  • (予定)文字起こしされた内容を要約する機能
  • (予定)入力した文書とあわせて要約する機能

まだコメントはありません。

まだコメントはありません。