DuckDB上でdplyrスタイルのパイプラインを試してみました

(duckdb.org)

2 ポイント投稿者 mrchypark 2026-01-06 | まだコメントはありません。 | WhatsAppで共有

DuckDBを分析作業に使いながら、
SQLだけでも十分に多くのことができると感じていました。

ただ個人的には、
SQLを書いていると分析プロセスが長くなるほど、
CTEをどんどん多用するパターンが繰り返されていました。

中間状態に名前を付けて固定しておかないと、
自分がどんな思考順序でこのクエリを作ったのかを、
自分自身でも見失いやすかったからです。

Rを長く使ってきたユーザーだからか、
filter → mutate → group_by → summariseのように
テーブルを段階的に扱うdplyr構文が、
ずっと頭の中に残っていました。

SQLでも同じ作業は可能ですが、
思考の順序をそのままコードに残すには、
少し不便だと感じました。

Rランタイムを再び載せたくはなかったですし、
だからといってこの感覚を説明だけで伝えるのも難しかったので、
DuckDB extensionの形でdplyrスタイルのパイプラインを
SQLに変換する小さな実験を作ってみました。

現時点では、次の程度だけを扱っています。

結合や複雑な再構造化（pivotなど）はまだ扱っていません。
完全なdplyr互換を目指したプロジェクトでもありません。
まだ自分の個人的な不便さから始まった実験なので、
似たような悩みを持ったことがある方の意見も気になっています。

関連記事