- LLMを使ってデータを変換し、データ可視化作業を迅速に処理する Microsoft Research のアプリケーション
- アナリストが AI でデータを変換し、豊かな可視化を反復的に作成できるよう支援
- ユーザーがすべてを自然言語で説明しなければならない大半のチャットベース AI ツールとは異なり、Data Formulator はユーザーインターフェース操作(UI)と自然言語(NL)入力を組み合わせ、より簡単に対話可能
- Python PIP でインストールするか、GitHub Codespaces で利用可能
- 基本的な使い方
- 自分の OpenAI キーを提供し、モデル(GPT-4o 推奨)を選択した後、データセットを選ぶ
- チャートの種類を選択し、データフィールドをチャート属性(x、y、色、...)へドラッグして視覚エンコーディングを指定
- 初期データセットを超えて可視化を生成する
- Encoding shelf に現在のデータに存在しない field 名を入力可能
- Data Formulator に対し、既存データから計算や変換が必要な可視化を生成するよう指示することになる
- 必要に応じて自然言語プロンプトを提供し、意図を説明して明確化できる(field 名が自明な場合は不要)
- Formulate ボタンをクリック
- Data Formulator がエンコーディングとプロンプトに基づいてデータを変換し、可視化をインスタンス化する
- データ、チャート、コードを確認
- 既存のチャートを基に新しいチャートを生成するには、自然言語で後続の操作を行う
- 後続プロンプトを提供(例: "上位 5 件だけ表示!")
- 新しいチャートの視覚エンコーディングを更新することも可能
2件のコメント
gptとpandasで粘ってみます
(今後この仕事を続けるなら)開発ツール、いや開発言語を新しく学ばないといけない気がします。