- Sunoのような商用レベルの音楽生成品質を、一般的なコンシューマ向けハードウェアでも実現したオープンソースの音楽生成モデル
- **10秒以内(RTX 3090)**で楽曲全体を高速生成
- 4GB VRAM以下の環境でもローカル実行可能で、LoRAベースの個人化学習によりユーザーの音楽スタイルの反映をサポート
- カバー生成、リペイント(部分再生成)、ボーカル→BGM変換、トラック分離およびマルチトラック合成をサポート
- 50以上の言語の歌詞プロンプトで構成・スタイルを制御可能
- 性能と品質の特徴
- **商用モデル(Suno v4.5〜v5相当)**以上の音質とスタイルの多様性を提供
- 1000以上の楽器・ジャンルをサポートし、細かな音色制御が可能
- 最大10分(600秒)の音声生成と8曲の同時バッチ生成をサポート
- LoRA学習機能を内蔵
- Gradio UIでワンクリックのアノテーション・学習が可能
- RTX 3090(12GB)基準で8曲・1時間以内に学習完了
- Side-Stepモジュールによる高度なLoRA/LoKRファインチューニングおよびVRAM最適化をサポート
- マルチプラットフォーム互換性:Mac(MLX)、AMD ROCm、Intel XPU、CUDA GPU、CPUをすべてサポートし、自動環境検出と設定スクリプトを提供
- 多様なインターフェースを提供
- Gradio Web UI: 直感的なWebベースの音楽生成インターフェース
- Studio UI: DAWに似た高度な編集環境
- Python API / REST API / CLI: サービス統合と自動化をサポート
- 英語・中国語・日本語・韓国語で提供される多言語ドキュメントセットを提供
- MIT License:創作・教育・エンターテインメント目的での利用を推奨し、著作権および文化的感受性の順守を求める
- 公式サイト: acemusic.ai
- 技術レポート: arXiv:2602.00744
- サンプルを聴く
3件のコメント
最近サウンドトラックを作るためにSunoを購読したのですが、
簡単なユースケースならサブスクリプション料金を抑えられそうですね
今日一度試してみないとですね
サンプルの中にK-POPもありますが、このレベルのものをローカルモデルで生成できるならかなり良いですね。
個人が作るゲームや映像の背景音楽くらいなら、もう本当に簡単になりそうです