Open-Interface: LLMでコンピューターを操作する
(github.com/AmberSahdev)- OpenAI APIキーを使ってコンピューターを操作できる。
- 必要なら他のLLMも使用可能。LiteLLMの支援を受けることもできる。
- LLMと通信し、その指示内容(マウス/キーボード入力)を模倣できる。
- 例:
- "今日の単語パズルを解いて。"
- "Google Docsを開いて昼食メニューを組んで。"
- "Webアプリケーションをコーディングして。"
- 誤作動を起こす可能性がある指示:
- 空間推論
- スプレッドシート操作
- マウスカーソルが必須の複雑なGUIアプリケーション
- 空間推論
- 予定:
- "Garage Bandでベースギターのサンプルを少し作って。"
- "Sportifyで友だちの音楽の好みを調べて、今夜のパーティーで使う再生リストを作って。"
- LLMによって約 $0.0005 - $0.002 程度のコストがかかると予想される。
- 'Stop' ボタンを押すか、カーソルを画面の隅に移動させて中断できる。
- マルチモニターの場合、メイン画面内でのみ動作できる。
まだコメントはありません。