- 1990年代の Sierra や LucasArts スタイルのアドベンチャーゲーム
- DALL-E にピクセルアートを直接描かせるよう指示しても、結果はよくない
- ピクセル化とディザリングには ImageMagick を使用
- 何度も試した末に、適した画像を作るためのスタイル文言を発見
→ " in the style of a high quality, atmospheric high renaissance oil on canvas painting"
- 遠近感を調整し、望む場所を表現するために行ったこと
- 時代、時間、照明を指定: "on a sunny day in the 2000s"
- 全体の場所について具体的に説明("town"、"city"、または有名な場所)
- フォーカスする場所("facade", "hotel entrance")と周囲の建物("houses"、"streets"、"plains")
- 明示的に空きスペースを要求できる: "…and street in front"、"plaza surrounded by…"
- スペースを空けるよう求める必要がある。そうしないと DALL-E が何かで埋めてしまう
- カメラ位置を指定できる: "seen from second-floor balcony"
- 絶対に "video game" を含めないこと。そうするとあらゆる部分が青いネオンで埋め尽くされる
- DALL-E は 1024x1024 の画像を作るので、現代の画面に合わせるには 19:10 程度に変える必要がある
- 画像を半分に切って、両側画像の空白部分を透明にした後、
- DALL-E に再アップロードして、同じプロンプトで残りを生成するよう指示
- 追加で何かを作るよう、プロンプトを修正することも可能
- 現在の DALL-E の価格体系で計算すると
- 成功するゲームにはおよそ 70 のシーンがあるが、50 で作ると仮定すると
- 望む場所の画像を1枚作るには、およそ 200 枚は試す必要がある。50 箇所なら合計 10,000 枚
- 修正と横方向の拡張のために 2 倍ほど必要だとすると、20,000 枚の生成が必要
- 20,000 * $0.0543 = 約 $1,087 なので、もう少し早くうまくいく場合もあると考えると、約 $1000
- 生成には1回あたり6秒かかるので、120000秒 = 33時間
2件のコメント
余談ですが、ImageMagick は本当に最高だと思います……
率直に言って、すごいですね!