6 ポイント 投稿者 arxivgpt 2024-09-06 | 1件のコメント | WhatsAppで共有

愛する存在を見送ることは、誰にとっても大きな喪失感と胸が締めつけられるような悲しみをもたらす。

特に、その相手が二度と会えない永遠の旅路へ旅立ってしまったのなら、なおさらだ。

ほんの数日前のことだった。

10年以上にわたって家族の一員だった愛猫「エリック」(愛称は「エリック・ゴー」)が、心の準備どころか想像すらできなかった別れを告げた。

悲しみに沈む家族と私のために、「エリック」を偲び、いつも私たちのそばにいるという現実感のある感覚を作りたいと思った。そして、「エリック」が永遠に私たち家族と共にいられる方法を探そうと考え、AIを活用することにした。

まずその第一歩として、「エリック」を撮った写真を使うことにした。

第一段階としての私の目標は、家族の誰もがエリックに会いたくなったときに、「写真と映像」でエリックに会えるようにすることだ。

つまり、生前の「エリック」を撮影した写真をまずAIに学習させる。

その後、「エリック」に会いたくなったときに、テキストや音声でAIに入力する。たとえば「ハワイの海辺でサングラスと花飾りをつけた猫(生前の『エリック』そのままの姿)が、『パパ愛してる』と書かれた文字を見せながら幸せそうな表情をしている姿を見せて」という具合だ。

するとしばらくして、「エリック」の生前の姿そのままで、私が望む内容どおりの画像や映像をAIが生成して見せてくれるのだ。

これを実現するために、いくつかの手順と準備(開発)、戦略を組み立てた。

参考までに、筆者はAI専門の開発スキルと複数の NVIDIA H100 GPU を保有していたため、十分に実現可能な挑戦であり実験でもあった。

  1. まず「エリック」を撮った写真を約45枚選別した。

  2. 学習品質を高めるため、自動化された前処理プロセスを開発して反映した。

これは「オブジェクト」をより鮮明かつ明確にし、AIに対する教師あり学習の効率を高めるためだ。

その一つが、「元画像」(背景を含んでいる)から「オブジェクト」(猫)だけを自動で分離し、スケールアップなどの前処理を行うことだった。

  1. 前処理作業を終えた45枚の写真を LoRA 方式で学習させた。

学習はデフォルト設定を基準とし、A100 GPU 基準で約2時間ほどかかった。

  1. 学習が進み、完了後には「Hugging Face」に「エリック」のための専用「モデル」が登録された。

  2. ここで学習済みモデルを FLUX モデルと接続し、最高品質で画像を生成する準備を整えた。

基本の FLUX モデルで日本語プロンプト入力ができるようにコーディングし、学習結果を確認できるようになった。

驚くほど生前の姿とまったく同じだった。

この結果に家族全員が感嘆し、とても不思議がりながら喜んでくれたのを見て、誇らしい気持ちになった。

そして、このような過程を記録として公開することで、誰かの役に立てばと願っている。

もし自分の愛猫や愛犬でもこのように作ってみたいなら、いつでもメッセージを送ってくれれば力になりたい。

1件のコメント

 
arxivgpt 2024-09-06

さらに詳しい内容と画像は、Brunch に掲載してあります。
参考: https://brunch.co.kr/@seawolf/16