- OpenAI GPT-4oを活用し、リアルなデータセットを対話形式で生成し、プレビュー・CSV/SQLエクスポート・Metabase連携までを一括でサポートするオープンソースツール
- 対話型プロンプトビルダー により、ビジネスタイプ、スキーマ、行数などを直感的に設定可能
- リアルタイムのブラウザプレビューに対応
- CSV(単一ファイルまたはマルチテーブルのZipファイル)やSQL Insert文としてエクスポート可能
- ワンクリックでMetabaseを起動してデータを探索可能
- 技術スタック: Next.js + Tailwind CSS + ShadCN UI + OpenAI API + Metabase
- プレビュー/仕様生成時にのみOpenAI API(約 $0.05)を使用し、データのダウンロード/分析はすべてローカルのFakerで無料生成 — データプライバシーとコストの両方を確保
- データセットのプレビュー時にはOpenAIを活用して、選択したビジネスタイプとパラメータに対する詳細なデータ仕様(スキーマ、ビジネスルール、イベントロジック)を生成
- 実際のすべてのデータ行は、LLMが生成した仕様に基づいてFakerを使ってローカルで生成される
- データをダウンロードまたはエクスポートする際には、もはやOpenAIを呼び出す必要がない
- スキーマオプション
- One Big Table (OBT): 関連するすべての列を含む非正規化単一テーブル
- Star Schema: 高度な分析向けの複数テーブル(ファクト + ディメンション)。構造はLLMの仕様に従って決まり、ジェネレーターがすべてのテーブルをローカルで出力
1件のコメント
実務でかなり役立ちそうですね。コスト面まで細やかに考慮しているようです。