Bark - TransformerベースのText-To-Audioモデル (github.com/suno-ai) 24 ポイント 投稿者 xguru 2023-04-24 | 2件のコメント | WhatsAppで共有 非常にリアルな多言語音声生成が可能 音楽、背景ノイズ、および簡単な効果音を含められる 笑い、ため息、泣き声のような非言語コミュニケーションも表現可能 英語/日本語およびドイツ語/フランス語/日本語/中国語などをサポート FacebookのEnCodecコーデックを使用 BarkはCC-BY 4.0 NCライセンスであり、Sunoモデル自体は商用利用が可能 関連記事 Zonos - 高品質なオープンウェイト音声合成モデル 24 ポイント · 2件のコメント · 2025-02-14 MetaVoice-1B - 12億パラメータのText-To-Speechモデル 12 ポイント · 0件のコメント · 2024-02-10 OpenVoice - 多才なインスタント音声複製技術 13 ポイント · 1件のコメント · 2024-03-30 Eleven v3 — 最も表現力に優れたテキスト読み上げモデル 9 ポイント · 2件のコメント · 2025-06-07 イラストで理解するトランスフォーマー 23 ポイント · 1件のコメント · 2025-12-23 2件のコメント dlehals2 2023-04-24 Bark の生成結果が、私のプロンプトと違うことがあります。何が起きているのでしょうか? Bark は GPT スタイルのモデルです。そのため、生成時にある程度の創造的な裁量を働かせることがあり、従来のテキスト読み上げ方式よりも出力のばらつきが大きくなる場合があります。 この部分はちょっと怖いですね… たまにプロンプトと違う生成になる理由が、モデルの創造的自由? のためだとは… kuroneko 2023-04-24 韓国語の生成がかなりうまいのが不思議ですね。
2件のコメント
Bark の生成結果が、私のプロンプトと違うことがあります。何が起きているのでしょうか?
Bark は GPT スタイルのモデルです。そのため、生成時にある程度の創造的な裁量を働かせることがあり、従来のテキスト読み上げ方式よりも出力のばらつきが大きくなる場合があります。
この部分はちょっと怖いですね… たまにプロンプトと違う生成になる理由が、モデルの創造的自由? のためだとは…
韓国語の生成がかなりうまいのが不思議ですね。