デバイス上でオフライン利用できる Easy Stable Diffusion XL

(noiselith.com)

2 ポイント投稿者 GN⁺ 2023-12-03 | 1件のコメント | WhatsAppで共有

Noiselithアプリの紹介

オフライン画像生成ツール: Noiselithは、クラウドなしでデバイス上で自由に画像を生成できるようにする。
プライバシー保護: すべての生成作業はローカルで行われ、情報がクラウドに送信されることはない。
無制限生成: 1日に100枚、200枚、さらには1000枚の画像を生成できる無制限生成機能を提供。
速度: サーバーリソースを待つ必要なく、デバイス上ですぐに画像を生成できる。

システム要件

Windows: Windows 10または11、NVIDIA RTX 20シリーズ以降のGPU（8GB以上のVRAM）、16GB以上のRAM、20GB以上のストレージ容量が必要。
macOS: macOS 12.3以降、Apple Silicon、32GB以上のRAM、20GB以上のストレージ容量が必要。

ユーザー体験

簡単なインストール: 数回クリックするだけでNoiselithを使う準備が整う。
直感的な操作: 技術的な詳細を気にせず、アイデアを視覚的に変換できる直感的なインターフェースを提供。
モデル管理: モデルを簡単にダウンロード、削除、更新でき、生成された画像を見やすく整理するギャラリーも提供。

開発ロードマップ

さまざまな機能への対応: SDXLモデル、SDXL LoRA、履歴管理、プロジェクト管理、モデル管理などへの対応を予定。
コミュニティと拡張性: ユーザーコミュニティ、SD 1.5および2.1モデル対応、モデルデータベース、アップスケーラー、スマートプロンプトなどの機能を含む。
Noiselithアプリストア: クラウドGPU、リモート共同作業機能を含むアプリストアの開発を計画。

GN⁺の意見

この記事で最も重要なのは、Noiselithアプリが、ユーザーのデバイス上でクラウドの助けなしにプライバシーを保護しながら無制限に画像を生成できる新しいツールだという点。
このアプリは、ソフトウェアのインストールや利用の複雑さを減らし、直感的なインターフェースによって誰でも簡単に画像生成を始められるようにすることで、創造的な作業により集中できるようにする点で興味深い。

1件のコメント

GN⁺ 2023-12-03

Hacker Newsのコメント

たった今インストールしてみたけど、かなりいい感じ。ローカルAIこそ自分が望む未来で、自分もそちらに取り組んでいる
良い点は、かなり独立して動作すること、内蔵のモデルインストーラーがよくできていてCivitAIから何でも簡単にダウンロードできること（https://civitai.com/models/183354/sdxl-ms-paint-portraits をインストールしてみた）、画像生成の品質が高く安定していること、生成の中間段階を見せてくれること
悪い点は、6.94GBのSDXLモデルファイルを、確認もせず、場所やサイズも表示しないまま、どこかにダウンロードすること。ただし後で設定から場所を見つけて変更できることが分かった。最初の生成はモデル読み込みのため非常に遅く、生成時間は記録されないが、M1 Max MacBook 64GBでは数分ほどかかるようだ
フィードバック用モジュールが複数あり、左下のチャットは非常に邪魔で絶対に使わなさそうだし、右上にもベータ版フィードバックの依頼がある。競合製品と違ってオープンソースではなく、プロセスが7個立ち上がっており、アイドル状態でRAMを約1GB使う。macOSネイティブのUXではなく、期待するショートカットキーやヘルプメニューが欠けていてElectronアプリのように見える。全体としては4/5点で、また開いてみる気はある
- macOSではDraw Thingsもチェックする価値がある。8GiBのmacOSデバイスでもSDXLは十分うまく動く
- 技術スタックが気になるならここにある: https://noiselith.notion.site/License-61290d5ed7ab4c918402fd2510533a9b
  なので、その通り。Electronアプリで、Svelte、headless-ui、tailwindcssなどを使っている
- ダウンロード先を尋ねるようにする必要がある
- もう一つの欠点は、Apple Silicon Macでしか動作しないこと
- そのアイドル時メモリ1GBがプロセスごとなのか、7プロセス全体の合計なのか気になる
ローカルの推論オプションはすでにかなり多く、重要なのはオープンソースで、機能もよりしっかりしている点だ
ここで「でもAuto1111やComfyはUIがユーザーフレンドリーじゃないだろう」と擁護するとしても、それもすでに解決されている: https://github.com/invoke-ai/InvokeAI
- InvokeAIに乗り換えたので、標準のa1111 webuiには戻らないと思う。全体のレイアウトが気に入っているし、ワークフロー機能があり、画像作成時に使ったプロンプト・モデル・LoRAなどすべての属性を簡単に再読み込みできる
  ボードで整理することもでき、ボード・画像・メタデータはすべてよく設計されたSQLiteデータベースに保存されていて、DataGripからアクセスできる
- Kritaに拡散AIプラグインを付けて使う方法もある: https://github.com/Acly/krita-ai-diffusion
- 「Stable Diffusionをローカルで実行」という宣伝文句は少し変だ。正直、すでに簡単にできることだからだ
- UIがユーザーフレンドリーかどうかは分からないが、InvokeAIのインストール手順だけでも、世界中の99.9%の人にとってはすでに障壁だ。Noiselithがオープンソースになれないという意味ではないが、InvokeAIとは明らかに違うものを提供している
まだ使ったことがない人にはFooocusを強く勧める: https://github.com/lllyasviel/Fooocus
ローカルのStable Diffusionパイプラインはものすごく多いが、これは短いプロンプトだけでもデフォルト出力の品質が圧倒的に良い。本当に印象的だ
理由は、他のUIが実装していなかったりデフォルトで有効にしていなかったりする多数のSDXL強化機能を統合しているからだ。Stable Diffusion 1.5の頃から使っていて、この分野もかなり追ってきたが、ComfyUIはもちろんdiffusersで同等のパイプラインをセットアップするのは苦行になりそうだ。SDXL向けの「ヒット機能集と最適なデフォルト値」のような感じだ
- Pythonの設定が怖かった。Python開発者なのにそうだった。それでも仮想環境を作って依存関係をインストールすれば終わり。本当にすごく、生成される画像が最初からきれいだ
  ただし隣のコメントで言われているように、GTMを組み込んでいるのは見栄えがよくない
  サンプル:
  https://imgz.org/i9oicVqo/
  https://imgz.org/i8Ur3WjW/
  https://imgz.org/i5j6r6TZ/
- Fooocusのセルフホスト版インストールのWeb UIは、ユーザーをGoogle Tag Managerに売り渡しているように見える
  業界全体が、こうした監視を回すのは悪い選択だと気づいて、ただやめてほしい
- Macでは自分でビルドする必要があるが、Pythonプロジェクトのビルドがどれほど「楽しい」かは皆知っている
- 最高のローカル生成結果を望むなら、Fooocusの方がずっと良い。Lvminは美しい絵を作ることに全エネルギーを注いでいる。GPLライセンスである点も自分にはプラスだ
- RAMが非常に多いCPU専用システムでも実用になるのか気になる
興味深い。ここ数か月、遊びで使っている https://diffusionbee.com と比べてみようと思う
- 両方確認してみたが、Noiselithの方がはるかに、はるかに良い結果を出す
マーケティングには良いかもしれないが、デバイス上での実行とオフラインを主な差別化ポイントとして打ち出すのは変だ。たいていの人はすでに Stable Diffusion をそうやって使っている可能性が高いからだ
インストールと使いやすさにもっと集中したほうがよさそう。それはまだうまくできていない部分だ。自分の基準では、ControlNet、アップスケーリング、顔のディテーラー系、できれば領域別プロンプティングがなければ使わない
それに、独自の SD 生成器を作りたがっている人たちは、すでに存在するオープンソースプロジェクトのどれかに貢献してくれたらいいのにとも思う
アプリストアは良いアイデアかもしれないが、Auto1111 とその膨大な拡張機能がある世界では、Stable Diffusion コミュニティには受けが悪そうだ
- 「マーケティングには良い」というのが要点だ。もっと押し出すべき。奇妙に見えるまさにその点が、この製品のターゲットを示している。すでに SD を使っている人たちではなく、Dall-E のようなオンライン専用サービスを使っている人たちを乗り換えさせようとしているのだ
- A1111 のようなものを使っていない人はかなり多いと思う。これをダウンロードするとあれをダウンロードし、さらにそれが別のものをダウンロードし、その次にはこのファイルとあのファイルを手動で入手しなければならない、という複雑なインストールモデルのせいだ
  既存ユーザーには魅力的でなくても、よりシンプルな製品は新規ユーザーには十分アピールできる
- Stable Diffusion にはクラウドのラッパーが妙に多いのを見てきた。だから、デバイス上/オフラインだと最初に明確に言っている点は気に入っている
  初めて SD を触ったとき、単にいくつかのファイルをダウンロードして実行する代わりに、ひどく「電話で家に送る」ような挙動をしたり、VM のようなものを使ったりするパッケージが多くて変だと思った
- デバイス上で SD を使ってみたが、ホスト版にお金を払う価値はあると感じた。ずっと速いからだ
販売用のプロンプトが「金髪の巻き毛の若い女性が、ファンタジー世界の背景の前で誘惑的なまなざしを向け、脚を開いて座り、白いシャツとデニムのホットパンツを着ている」だなんて
本当にこれでいいのかと思う
- プロンプトがある程度性的だったり、物議を醸したり、不快だったりしなければ、「それでも midjourney/dall-e/imagen には及ばない」という大合唱にそのままさらされていただろう。制限からの自由が主要なセールスポイントの一つなのだ
- オープンソースコミュニティで、どれほど多くの人が汗と血を注いでこうしたプロジェクトを作っているのか、本気で気になる。結局は男たちが MacBook をインスタポルノブックに変えられるようにする結果になるのに
- 不適切だと感じたのが自分だけではなくてよかった。かなり犬笛っぽく感じる
- あれは本当に気味が悪い
インストール後、Windows マシンで実行するにはパブリックおよびプライベートネットワークへのアクセス権限を与える必要があった。「オフライン」と言っておいてこれは少し引っかかった
- 似たようなことがあった
  初回実行時に約 30GB のデータをダウンロードした。その後の実行でオフライン動作するのかは分からない。自分の場合、その後はずっとクラッシュして再実行できなかったからだ
  アンインストール時にもすべてのデータを残していった。ユーザーデータではなく、実行ファイル本体、Python 仮想環境、アップデーター、すべてのモデルが残っていた。アンインストールは実質的にスタートメニューのショートカットを消しただけのようなものだった
- インターネットを完全に切断しても動き続けたのか気になる
  実行にアクティブなインターネット接続が必要なら、「オフライン」と宣伝するのは完全に間違っている
ローカルクライアントが増えるのは確かに歓迎だ。他のコメントで触れられているように、すでに優れたものもある。automatic1111を使ってみたが高速で、チューニングもそれほど必要ない。ただ、それでもノブやオプションが多く、最初は難しく感じる。Fooocus は非常に速いが、当然カスタマイズ性は低い
そしてComfyUIがある。複雑さの聖杯のような存在だが、その複雑さのおかげで本当に多くのことができる。ノードベースのアプリなのでカスタムワークフローを作成でき、画像が生成されたあと、その「ノード」を別の場所へ送り、アップスケーリングのような後処理を行える
Noiselith や他のツールが SDXLTurbo をサポートするか見てみたい。出てからまだ数日しか経っていないが、自分の考えでは完全にゲームチェンジャーだ。コンシューマー向け GPU で 512x512 画像を約 0.5 秒で作れる。品質がものすごいわけではないが、「森の中のキツネ」と入力して即座に見て、「帽子をかぶった」を追加してまた即座に生成できる能力は非常に価値がある。以前は画像 1 枚に 12 秒ずつ待っていた。大したことではないように聞こえるかもしれないが、これほど素早く反復できる点が、ローカル画像生成をはるかに楽しいものにしている
まだテストはできていないが、Comfy でCoreMLを使っているので、より便利なフロントエンドが出てくれば、こうしたプラットフォームのバックエンド最適化や性能面の作業もさらに増えるのか気になる
512 画像で 1〜4it/s はあまりにも残念だし、1024 で 2〜3s/it も今の基準では遅すぎる。しかも ANE ですら MacBook Pro M3 で SD 1024x1024 画像を動かせないというのは残念だ

デバイス上でオフライン利用できる Easy Stable Diffusion XL

Noiselithアプリの紹介

システム要件

ユーザー体験

開発ロードマップ

GN⁺の意見

関連記事

1件のコメント

Hacker Newsのコメント