今回リリースされた ElevenLabs Realtime Speech to Text を素早く使う方法
できるだけシンプルに、音声文字起こし機能だけを実装しました 🙏
- git clone https://github.com/lee-lou2/ai-note.git
- https://elevenlabs.io/app/developers/api-keys で「Speech to Text」にアクセスして API キーを発行
- clone したプロジェクトのページで
.env.sampleを複製し、.envファイルを作成 ELEVENLABS_API_KEYに作成した ElevenLabs API Key を登録し、BASIC_AUTH_USERNAME、BASIC_AUTH_PASSWORDにはページアクセス時に使用するアカウント情報を登録- パッケージをインストール:
pip install -r requirements.txt - 実行:
uvicorn main:app --reload --port 8000
そして http://localhost:8000 にアクセスするとすぐに使えます
ElevenLabs Realtime Speech to Text v2 は、確かに高速で精度も高いです
現在は無料ユーザーでも利用できます(今後 ElevenLabs の価格ポリシーが変更される可能性があります)
この GitHub リポジトリは今後も継続して更新する予定です
- (予定)複数のユーザーが同時に接続して 1 つのドキュメントを更新する機能
- (予定)文字起こしされた内容を要約する機能
- (予定)入力した文書とあわせて要約する機能
まだコメントはありません。