28 ポイント 投稿者 xguru 2023-06-09 | 9件のコメント | WhatsAppで共有
  • Redditユーザーのnhciaoが、ControlNet + LoRAを使って実際に動作するアニメ風QRコードを生成
  • QRコードが本来持っている誤り訂正機能によって可能になったもの
  • 中国の伝統的なパターン、浮世絵、2Dアニメーション、水墨画、水彩画、立体、抽象、PCBなど、さまざまなスタイルで活用可能
  • 詳細は中国語で書かれた元の投稿で確認可能

9件のコメント

 
yinn27 2023-06-10

すごいですね、発想が……

 
qkreoaksn 2023-06-09

すごい.....

 
popup 2023-06-09

QRの認識を試してみたら、ちゃんとできるんですね。すごいですね。

 
kuroneko 2023-06-09

理論上は可能だというのは理解できるのですが、それでもあれが本当に読み取れるという事実はどうしても納得できません。とても不思議です。

 
kuroneko 2023-06-09

元の文章を要約ツールに入れてみたところ、このような結果になりました。

  • この記事では、スキャン可能なQRコード画像を生成できる新しいControlNetモデルについて論じています。ControlNetは、人間の目には普通に見える画像に隠れた情報をエンコードできます。
  • 著者とその仲間たちは以前、パラメータ化されたQRコード生成器を作りましたが、更新は継続しませんでした。現在のアイデアは、Stable Diffusionの公開後に思いついたものです。
  • 初期のControlNetの試みは、中国の伝統的なパターンを学習することでした。著者は、AIGC All in OneドキュメントとHuggingFace JAX/Diffusersを使って学習したと述べています。
  • ControlNetを学習するには、大量のデータと計算資源が必要です。研究では最大300,000枚の画像と600 A100 GPU時間が使われました。著者は大きな学習率で100,000枚版の画像を学習させました。
  • 学習後、著者はさまざまなCheckpoint + LoRA + QR Code ControlNetの組み合わせをテストし、中国伝統パターン、浮世絵、2D、インク、遠近法、抽象、PCBスタイルなど、さまざまなスタイルのスキャン可能なQRコードを生成しました。
  • 生成されたQRコードには、中国伝統パターン、浮世絵スタイル、アニメーション、イラスト、インク、水彩、3D、抽象スタイルがあります。
  • このプロジェクトは、数人の仲間たちとの協力と研究室のGPUリソースに依存していました。Google TPUサーバーも学習速度の向上に役立ちました。
  • 著者は今後、WeChat公式アカウントとウェブサイトでモデルと技術文書を公開する予定です。
  • この記事では、AI生成モデルが急速に進化していることに触れ、もう一度大学生活をやり直したいという気持ちを表しています。
  • 著者は、TPUサーバーを提供してくれたGoogleとHuggingFaceに対し、「楽しい時間を過ごせた」と感謝を述べています.
 
lunamoth 2023-06-09

ちなみに、要約ツールはどのサービスをお使いか教えていただけますか?

 
kuroneko 2023-06-11

KagiのUniversal Summarizerを使っています。

 
lunamoth 2023-06-11

教えていただきありがとうございます