Microsoft Visual ChatGPT
(github.com/microsoft)- ChatGPT と Visual Foundation Model を接続し、チャット中に画像の送受信をサポート
- ChatGPT は言語ベースで学習されているため、画像の処理や生成はできない
- VFM は画像を理解して処理できるが、単発の入力と出力しかできない
- 両者を接続することで、画像生成、生成した画像の変更、送信した画像内の特定の物体の削除または変更などが可能
- 言語とともに画像を送信可能
- 複雑な視覚的質問や編集命令により、多段階のAIモデル間で協業
- 修正された結果に対するフィードバックなど
1件のコメント
ひとたび流れができると、本当にものすごいスピードで進化していますね