29 ポイント 投稿者 GN⁺ 2026-01-06 | 1件のコメント | WhatsAppで共有
  • 2025年は、PostgreSQLの支配力強化MCP標準の普及大型M&Aファイルフォーマット競争の再燃Larry Ellisonの台頭 などで要約される年だった
  • PostgreSQLは主要クラウド企業の中核DBaaSとして定着し、分散型プロジェクト(Multigres, Neki, PgDog) が新たに登場
  • すべての主要DBMSが AnthropicのModel Context Protocol(MCP) を採用し、LLMとデータベースの統合が本格化
  • MongoDBはFerretDBに対して API複製関連訴訟 を提起し、ファイルフォーマット分野では Parquet代替競争 が激化
  • 業界全体で買収・閉鎖・資金調達が活発に続き、データベース産業の再編と集中化 が加速した1年と評価される

PostgreSQLの継続的な拡大

  • PostgreSQL 18が2025年11月に公開され、非同期I/Oストレージサブシステムskip scan 機能を導入
    • OSページキャッシュへの依存度を下げ、複合キーインデックスの活用を改善
  • Databricksは Neon を10億ドルで、Snowflakeは CrunchyData を2億5,000万ドルで買収
    • Microsoftは HorizonDB をリリースし、主要クラウド企業がすべてPostgreSQLベースのサービスを保有することになった
  • Supabaseの Multigres、PlanetScaleの Neki、PgDogなど、分散型PostgreSQLプロジェクト が新たに登場
    • SupabaseはVitess共同創業者のSuguを迎え、シャーディングミドルウェア開発を主導
  • 独立系PostgreSQLサービスとしてはSupabase、YugabyteDB、TigerData、PlanetScale、Xata、PgEdge、Nileなどが活動
    • Hydra、PostgresMLなど一部のスタートアップは2025年に事業終了
  • PostgreSQLを軸とした M&A競争と技術進化 が業界の中核的な推進力として機能

MCP(Model Context Protocol)の全面的普及

  • 2025年には、すべての主要DBMSが AnthropicのMCP標準 をサポート
    • MCPは、LLMがデータベースと相互作用できるようにする JSON-RPCベースのインターフェース
  • OpenAIが2025年3月にMCP対応を発表して以降、ClickHouse、Snowflake、Oracle、MongoDBなど主要システムがMCPサーバーを公開
    • PostgreSQLベースのサービスもそれぞれ独自のMCPサーバーを提供(Supabase、Timescale、Xataなど)
  • MCPサーバーは単一リクエスト単位でデータベースにアクセスし、異種DB間のJOIN機能には未対応
  • Neonはデータブランチ機能を通じて、AIエージェントが生成するDBの80% を担う
  • セキュリティ面では、最小権限と自動保護メカニズム の必要性が強調された
    • 一部システムは読み取り専用制限、クエリタイムアウト、結果件数制限などの基本的な保護機能を提供

MongoDBとFerretDBの法的紛争

  • MongoDBが2025年、FerretDBに対して 特許・著作権・商標権侵害訴訟 を提起
    • FerretDBはMongoDBクエリをPostgreSQLへ変換する ミドルウェアプロキシ であり、「drop-in replacement」という文言の使用が問題として指摘された
  • MicrosoftはMongoDB互換のオープンソース DocumentDB をLinux Foundationに寄贈
    • Amazon、Yugabyteなどもプロジェクトに参加
  • MongoDBの「非リレーショナルDBを開拓した」という主張に対し、1960年代の IDS、IMS など先行システムの存在が指摘された
  • FerretDBの初期名称が「MangoDB」だった点も、商標混同論争 として言及された

ファイルフォーマット競争の再燃

  • 2025年には、Parquetの牙城に挑む 5つの新しいオープンソースファイルフォーマット が登場
    • FastLanes(CWI)、F3(CMU+清華大学)、Vortex(SpiralDB)、AnyBlox(ドイツの研究チーム)、Amudai(Microsoft)
  • SpiralDBの Vortex はLinux Foundationに寄贈され注目を集め、AnyBloxは VLDB最優秀論文賞 を受賞
  • Parquet開発陣はこれに対応して 仕様のモダナイゼーション作業 を推進
  • Pavloが関わった F3フォーマット は、WASMベースのデコーダ内蔵 により相互運用性の問題解決を目指す
  • 次世代の競争は GPU対応の有無 へと進む可能性が高い

M&A・投資・事業終了の動向

  • 2025年の主要買収事例
    • IBMが DataStaxConfluent を買収、Databricksが Neon・Tecton・Mooncake を買収
    • Snowflakeが CrunchyData・Datometry、Salesforceが Informatica、Nvidiaが HeavyDB を買収
    • Fivetranとdbt Labsが 電撃合併 し、ETL統合プラットフォームへ再編
  • 主な投資ラウンド
    • Databricks(40億・10億ドル)、ClickHouse(3.5億ドル)、Supabase(2億・1億ドル)、Timescale(1.1億ドル)など
  • 事業終了事例
    • FaunaPostgresMLHydraMyScaleDBVoltron DataApache Derby など
    • IBM Research Almaden研究所の閉鎖により、DB研究の象徴的な終着点 とも言及された
  • PavloはGPUベースDBの商業的限界を指摘し、CPUベースOLAPエンジンの成熟とユーザー体験中心の競争 を強調

Larry Ellisonの「最高の年」

  • 2025年、Oracle創業者 Larry Ellison世界一の富豪(3,930億ドル) に浮上
    • Oracle株の急騰とAIデータセンター投資により資産が急増
  • Oracleは TikTok米国法人の買収ParamountによるWarner Bros買収の試み など大型取引に関与
  • PavloはEllisonの動きを「データベースで世界を征服した人物の象徴」と描写
    • 批判にもかかわらず、Oracleの影響力とEllisonの存在感 はなお圧倒的

結論

  • 2025年のデータベース産業は、PostgreSQL中心の再編AI・LLM統合の加速大型M&Aと事業終了の二極化 に要約される
  • Pavloは、研究者と業界の双方が セキュリティ・標準化・運用自動化 に集中すべきだと強調
  • 最後に、CMU研究チームの新しいスタートアップ Sydht.ai の立ち上げを予告して記事を締めくくる

1件のコメント

 
GN⁺ 2026-01-06
Hacker News の意見
  • CMU DB Group の独特な 講義スタイル はぜひ見るべき
    YouTube の検索結果で確認できる。
    特に gangsta イントロDJ セット が本当に印象的だった。
    以前、講義中に誰かが床で寝ていた動画も覚えている。Andy の 経歴と文脈 がもっと気になる

    • Wu-Tang とヒップホップのファンなら共感できるはず。あのイントロは本当に最高だった
    • CMU の “Intro to Database Systems” が学部レベルなのか、内部構造を扱う上級コースなのか混乱している。データベース初心者として適切な入門講座を探したい
    • リンクに “https://” を付けてクリック可能になるよう修正した
  • ここ数年のレビューで immutablebi-temporal データベース が言及されていないのが残念
    こうした DB は特に フィンテック業界 で非常に有用。
    代表例として XTDB v2 (2025)Datomic Free (2023) がある

    • CMU では 5 週間前に XTDB に関する 技術セミナー を実施していた。
      「単に存在している」と触れるだけで十分なのか気になる
    • PostgreSQL の tstzrange 型と pg_bitemporal 拡張 を活用すれば、かなりのことができる。
      私たちは row trigger ベースの 監査ログシステム で変更履歴と undo 機能を実装した。
      さらにログを別ストレージに移して オフラインバックアップ も維持している
    • Immutable DB の利点はますます認識されつつある。単なる監査機能だけでなく、同時読み取り、高速レプリケーション、トランザクションの undo などさまざまな利点がある。
      私は現在 immutable SQLite を開発中 — xitdb-java
    • 一部では triple store に時間性と不変性を付け加えている。xtdb や datomic が SPARQL グラフ探索で遅いからだ。
      タイムトラベル対応 triple store に期待している
    • 私も似た意見を 別のコメント に残した
  • 2025 年のデータベーストレンドは 2 つに要約できる
    1️⃣ すべてを SQLite に移行
    2️⃣ JSON フィールド 中心で使う
    SQLite は単一ファイル構造とデーモン不要の設計のおかげで扱いやすい。JSON 関数のおかげで柔軟なデータ処理も楽しい

    • 私の観点では最近は全部 DuckDB だ。単一ファイル、さまざまなフォーマット対応、S3・Parquet・カラムストア・WASM など完璧
    • 正直「DB が本当に必要か?」とも思う。SQLite は完全な DB と自作のオブジェクトストレージの中間地点だ。
      一種の 正規化されたオブジェクトアクセス API を提供している
    • SQLite がマルチユーザー環境向けでないとして、複数の Web 接続が同時に書き込みを行う場合、どの程度まで耐えられるのか気になる
    • 以前は SQLite を本番環境で使うなという認識があったが、最近は変わってきたようだ
    • 私の基準では「可能なら SQLite、必要なら PostgreSQL、分析には DuckDB、大規模 BI には BigQuery」という組み合わせが理想的
  • Pavlo が MCP セキュリティに懐疑的な理由は理解できる。MCP は 最小権限の原則 と逆行する、コンテキスト露出中心の哲学を持っている
    DB をこうしたプロトコルで公開すると、単なるデータだけでなく スキーマの複雑さ までモデルに露出する。
    結局 SQL インジェクションの再現 のように感じる — 今回は悪意ある利用者ではなくモデルの幻覚が原因だ

    • LLM が stateless である点を利用し、入力コンテキストの出所を追跡して危険な状態変更を遮断する MCP ゲートウェイ を作った。
      Simon Willison の lethal trifecta フレームワークに基づいており、open-edison で確認できる
    • 本番環境で 書き込み権限のある DB MCP を使う人はいないはず。それをプロトコルのせいにするのは不当だ
    • 私たちは原則を捨てるほどの価値を得られたのだろうか疑問だ。おそらく “move fast, break things” 精神の延長線にすぎない
  • Immutable DB への移行が必要だと感じる。
    Datomic は強力だが 複雑で学習曲線が急 で、immudb はまだ 本番運用の準備が不十分
    数十万レコードを超えるだけでも問題が起きる

  • Supabase がものすごい成長を見せている。YC スタートアップの約 70% が使っているという話も聞いた。
    彼らが後で self-hosted に移るのか気になる

  • EdgeDB が Gel に改名した理由には触れられていたが、買収セクションにも追加されるべきだった。
    Gel は Vercel に参加 した

    • ありがとう。ブログに 訂正リンク を追加した。
      こうした変更を自動で追跡する方法を見つける必要がある
    • 正直がっかりだ。Vercel の 公式投稿 を見ても、Gel の将来は不透明に見える。
      GitHub の最後のコミットも 2 週間前だ
  • CMU の Andy と DB Group のおかげで、データベースはずっと 大衆的 になった。本当に世界レベルのチームだ

    • 具体的に何をしたのか気になる
  • PostgreSQL 18 リリースは本当に素晴らしい。
    多くの人は async IO worker の話しかしないが、Unicode localeunvalidated 制約の追加仮想カラムbtree skip scanUUIDv7 なども大きな改善だ

  • ここ数年の 複数年にまたがるトレンド が印象的。
    Databricks と Snowflake はクラウド競争の中でも 俊敏さと生存力 を証明した。
    一方で Cloudera と Hortonworks は失敗した。
    さらに ClickHouse は静かに自分のニッチを完璧に埋めつつある