ElevenLabs Voice Isolator - 音声だけをクリアに分離 (elevenlabs.io) 22 ポイント 投稿者 xguru 2024-07-06 | 6件のコメント | WhatsAppで共有 映画、ポッドキャスト、インタビューなどで背景ノイズを除去し、音声だけをクリアに抽出してくれる 最大サイズは500MB、最長1時間の音声まで対応 音楽ボーカル向けに設計・最適化されているわけではない(コンテンツによってはうまくいく可能性あり) まだリアルタイムストリーミング向けAPIは公開していないが、近日公開予定 利用料金は音声1分あたり1000文字 関連記事 Eleven v3 — 最も表現力に優れたテキスト読み上げモデル 9 ポイント · 2件のコメント · 2025-06-07 Eleven Labs、AI吹き替えを発表 9 ポイント · 3件のコメント · 2023-10-18 Voxtral Transcribe 2モデルを公開 13 ポイント · 1件のコメント · 2026-02-05 ClovaNoteやdagloの代替になり得る ElevenLabs Realtime Speech to Text をすぐ試してみる! 7 ポイント · 0件のコメント · 2025-11-17 AlphaClip – AIベースの動画背景除去&音声分離ツール 2 ポイント · 0件のコメント · 2026-02-02 6件のコメント savvykang 2024-07-06 Voice Isolator の料金はどれくらいですか? Voice Isolator は、音声1分ごとに1000文字分のコストがかかります。 これはどういう意味でしょうか? なぜ文字数が出てくるのか分かりません brainer 2024-07-06 トークンのような概念ではないですか? GPTで画像も text token のように計算されるように。 savvykang 2024-07-06 会社が提供しているほかのサービスを見ると納得できます。Speech to text to Speech 方式のようですね。だから中間テキストに対して課金しているのでしょう。 qyurila 2024-07-06 一方、さまざまなオープンモデルによるボーカル分離を無料・有料で提供しているMVSepでも、数種類の音声/ノイズ分離モデルを提供しています。 https://mvsep.com xguru 2024-07-06 Adobe Podcast AIも似たような機能を提供しています。無料版もあるようです https://podcast.adobe.com/enhance brainer 2024-07-06 無料版基準では、韓国語は最適化されていない感じでしたね…。
6件のコメント
これはどういう意味でしょうか? なぜ文字数が出てくるのか分かりません
トークンのような概念ではないですか?
GPTで画像も text token のように計算されるように。
会社が提供しているほかのサービスを見ると納得できます。Speech to text to Speech 方式のようですね。だから中間テキストに対して課金しているのでしょう。
一方、さまざまなオープンモデルによるボーカル分離を無料・有料で提供しているMVSepでも、数種類の音声/ノイズ分離モデルを提供しています。
https://mvsep.com
Adobe Podcast AIも似たような機能を提供しています。無料版もあるようです https://podcast.adobe.com/enhance
無料版基準では、韓国語は最適化されていない感じでしたね…。