LegoGPT - テキストから実際に組み立て可能な LEGO デザインを自動生成
(avalovelace1.github.io)- LegoGPTは、テキスト入力だけで安定していて実際に組み立て可能な LEGO 構造物を生成する革新的なプロジェクト
- StableText2Legoデータセットを構築し、47,000件以上の物理的に安定した LEGO 構造と詳細な説明を提供
- アルゴリズムは高速な妥当性検証と物理ベースのロールバックを適用し、非現実的な構造物を自動的に除去
- 生成された LEGO デザインは人間とロボットの両方が実際に組み立て可能で、多様な色彩や質感表現にも対応
- このシステムは創造的なデザインのプロトタイピング、教育、ロボティクス応用など、さまざまな分野に新たな可能性を開く
プロジェクト紹介
- LegoGPTは、ユーザーが入力したテキストプロンプトをもとに、完全自動で実際に組み立て可能かつ物理的に安定した LEGO 構造物を生成する初のアプローチ
- このプロジェクトは、大規模な LEGO 構造データセットと詳細な説明を含めて構築されており、実際の組み立て工程でも安定性、多様性、美観の完成度を備えた結果を生成
- 生成された LEGO 構造物は、実際に人が手で組み立てたり、ロボットアームで自動組み立てしたりできることが実験的に検証されている
StableText2Lego データセット
- StableText2Lego データセットは、ShapeNetCore の 3D メッシュから形状をボクセル化した後、さまざまなブリック配置手法を適用し、物理的安定性検証を通過した構造のみを採用
- データ生成過程では、各構造物について24の角度からビューをレンダリングし、それをもとに GPT-4o が精密な説明文を自動生成
- このように構築されたデータセットには、多様な形状、構造、テクスチャを持つ47,000件以上の LEGO 構造と28,000件以上の固有 3D オブジェクトが含まれる
LegoGPT パイプライン
- LEGO 構造物は下から上へ、ラスタースキャン方式でテキストトークン列としてトークナイズされ入力される
- 各ブリック列と自然言語説明をペアにして、LLaMA-3.2-Instruct-1Bベースのモデルをファインチューニングし、説明-ブリック列マッピングを学習
- 推論段階では、LegoGPT はテキストプロンプトに対してブリックを1つずつ予測・追加する方式で LEGO 構造を段階的に生成
- 各ブリック追加時には、形式、ブリックライブラリ内での存在、衝突の有無について妥当性検証を行い、構造物全体の生成後に物理的安定性を再検証
- 最終構造が不安定な場合は、不安定なブリックとその後に追加されたブリックをすべて削除し、安定した状態までロールバックして再生成
段階的な LEGO 構造生成の例
- "細長い船体を持つスリムな船"
- "水平棚のある本棚"
- "背もたれがなく肘掛けのあるベンチ"
- それぞれの例は、テキストプロンプトから視覚的特徴を明確に反映した LEGO 構造として段階的に生成される
ロボットを活用した自動組み立て
- 生成された LEGO モデルは、ロボットアームを用いた実際の組み立てに適用され、8倍速映像でデモされている
- "細長い船体を持つスリムな船"、"非対称 6 弦ギター" などで、実際のロボット組み立てへの適用可能性を示している
生成されたテクスチャおよびカラー LEGO モデル
- 自然言語プロンプトに "苔むしたベンチ"、"ネオングラデーションのサイバーパンク素材"、"ヴィクトリア調書斎の棚" などを指定することで、質感、素材、特定の美的効果まで表現可能な LEGO デザインを提供
- "Sunburst Les Paul with amber finish" のような多彩な色彩や金属的効果も、テキストだけで反映した LEGO 設計が可能
引用と研究支援
- 論文情報、著者、およびこの研究を支援した機関(例: Packard Foundation、Amazon Faculty Award など)が明記されている
- 主要研究者のMicrosoft Research PhD Fellowshipなど、さまざまな学術的・産業的支援のもとで進められたプロジェクト
プロジェクト参考およびテンプレート
- このサイトのテンプレートは、Custom DiffusionおよびDreamFusionプロジェクトのレイアウトを参考に活用されている
1件のコメント
Hacker Newsのコメント
videoタグにplaysinline属性を付ければ、この問題を修正できる https://developer.mozilla.org/en-US/docs/…