Thoughtworks Technology Radar、Vol. 33を公開
(thoughtworks.com)- 技法/ツール/プラットフォーム/開発言語およびフレームワーク分野の最新トレンドを、Adopt(導入推奨)、Trial(試験利用)、Assess(評価)、Hold(注意)の4段階で可視化・解説
- 主なテーマ4つ: AIインフラのオーケストレーション、MCPベースのエージェントの台頭、AIコーディングワークフロー、AIアンチパターンの出現
AIにインフラオーケストレーションを導入
- AIワークロードにより、組織は訓練と推論のための大規模GPUフリートのオーケストレーションを求められている
- 単一GPUのHBM容量(80GB)の限界を超える大規模モデルが増える中、分散トレーニングとマルチGPU推論が必須になっている
- プラットフォームチームは複雑な多段パイプラインを構築し、スループットとレイテンシを継続的に調整
- Nvidia DCGM Exporterでフリートのリモートテレメトリを実施し、トポロジー認識スケジューリングでインターコネクト帯域幅が最も高い場所にジョブを配置
- KubernetesはAIワークロードを大規模に管理する中核基盤だが、microVM(Firecracker)、Uncloudのような代替プラットフォームにも注目が集まっている
- Kueueによるキューおよびクォータ管理、トポロジー認識スケジューリング(topology-aware scheduling)、gang schedulingなど、GPUリンク間の高速通信を考慮した配置戦略が発展中
- NVLink/NVSwitchのような高速GPU間リンクとRDMAを備えた連続的なデータセンター「アイランド」(ラックまたはポッド)内でマルチGPUジョブを配置
- Kubernetesの最近のマルチGPUおよびNUMA認識APIの改善がこれらの能力を強化しており、デバイス間帯域幅の向上、テールレイテンシの低減、効果的な利用率の増加につながっている
- AIコーディングワークフロー需要の増加と、MCPによって強化されたエージェントの台頭により、AIインフラでは急速なイノベーションが予想される
- GPU認識オーケストレーションが基本要件となりつつあり、トポロジーがいまや第一級のスケジューリング考慮事項として浮上
MCPベースのエージェントの台頭
- MCPとエージェントの同時的な台頭、そしてそれを中心に構築されたプロトコルおよびツールのエコシステム拡大が、今回のRadarの主要テーマ
- MCPはエージェント駆動と効率的・半自律的な動作のための究極の統合プロトコルとして定着しつつある
- ほぼすべての主要ベンダーがMCP対応を追加しており、エージェント中心ワークフローが急速に成長
- エージェントワークフローの継続的なイノベーションが観察されており、コンテキストエンジニアリングがモデルの挙動とリソース効率最適化の鍵として浮上
- A2A(Agent-to-Agent)、AG-UIのような新しいプロトコルが、マルチエージェント協調アプリ構築の複雑さを下げている
- AGENTS.md、Anchoring coding agents、Context7 MCP serverなどの技術が、実際の開発ワークフローに採用されている
- AIエコシステムの特性上、各Radarごとに新たなイノベーションが爆発的に発生
— 前回はRAGで、今回はエージェントワークフローと、それを支えるツール、技法、プラットフォームの成長する集合体(constellation)- そして注目すべきAIアンチパターンも一部登場
AIコーディングワークフロー
- AIがソフトウェアの構築および保守の方法を変えており、最近の議論で支配的なテーマとなっている
- レガシーコードベース理解のためのAI活用からフォワードエンジニアリングのためのGenAIまで、ソフトウェア価値連鎖全体に戦略的に組み込まれている
- コーディングエージェントに知識をより効果的に供給する方法を学習
- チームは、AGENTS.mdファイルによるカスタム指示の定義、Context7のようなMCPサーバーとの統合による最新の依存関係ドキュメントの取得など、新しい実践を試している
- AIは個々の貢献者だけでなく、チーム全体を増幅すべきだという認識が高まっている
- キュレーションされた共有指示とカスタムコマンドが、公平な知識の普及を保証するために登場
- ツール環境は活発に進化中:
- デザイナーはUX PilotとAI Design Reviewerを活用し、開発者はv0とBoltでセルフサービスUIプロトタイピングを通じて迅速にプロトタイプを作成
- スペックベース開発の範囲、粒度レベル、段階的提供の単一の真実の供給源として機能しうるかをめぐる議論が継続
- 盛り上がりの中でも、AI生成コードに対する安易さは依然として共通の懸念事項であり、AIはエンジニアリングを加速できても人間の判断は依然として不可欠であることを再認識させる
新しいAIアンチパターンの出現
- 業界全体でのAI採用加速により、効果的な実践とともに新興アンチパターンも表面化
- GenAIを活用したセルフサービス型の使い捨てUIプロトタイピングのような概念の明確な有用性を認めつつも、組織をAI加速型Shadow ITアンチパターンへ導く潜在性を認識
- MCP(Model Context Protocol)が注目を集める中、多くのチームが安易なAPI-to-MCP変換アンチパターンに陥っている
- Text-to-SQLソリューションの有効性は当初の期待に届いておらず、AI生成コードに対する安易さも依然として関連する懸念事項として続いている
- スペックベース開発のような新興実践の中でも、従来のソフトウェアエンジニアリングのアンチパターンに回帰するリスクがある
— 特に過度な事前仕様化とビッグバンリリースへの偏り
- スペックベース開発のような新興実践の中でも、従来のソフトウェアエンジニアリングのアンチパターンに回帰するリスクがある
- GenAIは前例のない速度と規模で進化しており、新たなアンチパターンが急速に現れると予想される
- チームは、当初は効果的に見えても時間が経つにつれて性能が低下し、フィードバックを遅らせたり、適応性を損ねたり、責任の所在を曖昧にしたりするパターンに対して警戒を維持する必要がある
ThoughtWorks Technology Radar Volume 33
[Techniques]
Adopt
1. Continuous compliance
- ソフトウェア開発プロセスと技術が、規制およびセキュリティ標準を自動化によって継続的に満たすことを保証する実践
- Open Policy Agentのようなpolicy-as-codeツールの統合、CDパイプライン内でのSBOM生成により、SLSAガイドラインに沿って初期段階でコンプライアンス問題を検知・解決
- ルールとベストプラクティスをコード化すれば、ボトルネックなしでチーム全体に一貫して標準を強制できる
- AI生成コードに対する安易さのリスク増大により、開発プロセスにコンプライアンスを組み込むことがこれまで以上に重要
2. Curated shared instructions for software teams
- AIをソフトウェアデリバリーに積極的に活用するチームでは、個人のプロンプトを超えてキュレーションされた指示へ移行
- AGENTS.mdのような指示ファイルをプロジェクトリポジトリに直接コミットするのが、最も直感的な実装方法
- Cursor、Windsurf、Claude Codeなど、ほとんどのAIコーディングツールがカスタムスラッシュコマンドやワークフローを通じた指示共有をサポート
- プロンプトが改善されるたびにチーム全体が恩恵を受け、最良のAI指示への一貫したアクセスを保証
3. Pre-commit hooks
- Git hooksは長らく存在しているが、依然として十分に活用されていない
- AI支援およびエージェントコーディングの台頭により、秘密情報や問題のあるコードを誤ってコミットするリスクが増加
- continuous integrationのようなコード検証メカニズムは数多くあるが、pre-commitフックはより多くのチームが採用すべきシンプルで効果的な安全策
- 秘密情報スキャンのように、このワークフローステップで最も効果的に捕捉できるリスクに集中し、最小限かつ焦点を絞るのが最善
4. GenAIを使ったレガシーコードベースの理解
- GenAIを使ったレガシーコードベースの理解は、大規模で複雑なシステムの把握を大きく加速する
- Cursor、Claude Code、Copilot、Windsurf、Aider、Cody、Swimm、Unblocked、PocketFlow-Tutorial-Codebase-Knowledge のようなツールが、ビジネスルールの可視化、ロジックの要約、依存関係の特定を支援する
- オープンフレームワークや直接的なLLMプロンプティングと併用することで、レガシーコードベースの理解にかかる時間を劇的に短縮できる
- GraphRAGのような高度なアプローチのセットアップ工数は、特に分析対象のコードベースの規模や複雑さによって異なるが、生産性への影響は一貫して大きい
Trial
5. AGENTS.md
- プロジェクトで作業するAIコーディングエージェントに指示を与えるための共通フォーマット
- 本質的にはエージェント向けのREADMEファイルであり、Markdown以外に必須のフィールドやフォーマットはない
- LLMベースのコーディングエージェントが、人間によって書かれ読める指示を解釈する能力に依存している
- コーディング環境でのツール利用のヒント、テスト手順、コミット管理のための推奨プラクティスを含めるのが一般的な使い方
6. コード移行のためのAI
- コード移行は、言語の書き換えから依存関係やフレームワークのアップグレードまでさまざまな形があり、数か月にわたる手作業を要することも多い
- .NET framework version のアップグレードチームが、プロセス短縮のためにAI活用を実験している
- これまでは OpenRewrite のような決定論的なルールベースのリファクタリングツールが使われてきたが、AIだけではコストが高く、対話が脱線しやすい
- 全体のアップグレードを委ねるのではなく、コンパイルエラーの分析、移行diffの生成、テストの反復検証といった、より小さく検証可能なステップにプロセスを分解する
- Googleの大規模な int32-to-int64 migration のような業界事例も、同様のトレンドを反映している
7. Delta Lake liquid clustering
- Delta Lake テーブル向けの技術で、パーティショニングやZ-orderingの代替となる
- 歴史的に、Deltaテーブルの読み取り性能最適化では、想定されるクエリパターンに基づいてテーブル作成時にパーティションキーやZ-orderキーを定義する必要があった
- liquid clustering は、指定したキーに基づいてデータをクラスタリングするツリーベースのアルゴリズムを使用する
- すべてのデータを書き直すことなく段階的に変更できるため、多様なクエリパターンへの対応により高い柔軟性を提供する
- Databricks Runtime for Delta Lake は、過去のクエリワークロードの分析、最適なカラムの特定、それに応じたデータクラスタリングによって、自動 liquid clustering をサポートする
8. GenAIを使ったセルフサービスUIプロトタイピング
- Claude Code、Figma Make、Miro AI、v0 のようなツールにより、プロダクトマネージャーがテキストプロンプトから直接、対話型でユーザーテスト可能なプロトタイプを生成できる
- 手動でワイヤーフレームを作成する代わりに、チームは数分で機能するHTML、CSS、JSアーティファクトを生成できる
- こうした「使い捨て」のプロトタイプは、洗練度を素早い学習と引き換えにし、デザインスプリント中の初期検証に最適である
- より高い忠実度は、細部への誤った注目や本番投入に必要な工数への非現実的な期待につながる可能性があるため、明確な位置づけと期待値の管理が不可欠
9. LLMからの構造化出力
- LLMがJSONや特定のプログラミングクラスのような事前定義された形式で応答を生成するよう制約する実践手法
- LLMの通常は予測しにくいテキストを、機械可読で決定論的なデータ契約へ変換するものであり、信頼できる本番級アプリケーションの構築に不可欠
- 単純なプロンプトベースのフォーマット指定や model-native structured outputs から、Outlines や Instructor のようなツールを使った、より強力な制約付きデコーディング手法まで、アプローチは多様である
- さまざまな文書タイプから複雑で非構造的なデータを抽出し、後続のビジネスロジック向けの構造化JSONへ変換する用途で成功裏に使われている
10. TCR (Test && Commit || Revert)
- テスト駆動開発から派生したプログラミングワークフローで、シンプルなルールによって非常に小さく継続的なステップを促進する
- 変更のたびにテストが通れば変更はコミットされ、失敗すれば変更は元に戻される
- コードベース内でこのサイクルを自動化するスクリプトを定義するだけでよいため、実装は簡単である
- Kent Beckの正式な article で最初に紹介されたTCRは、YAGNI や KISS のような前向きなコーディング実践を強化する
Assess
11. AI活用UIテスト
- 以前のRadarでは、AIベースのUIテストは主に探索的テストに焦点を当てており、LLMの非決定性が不安定さを引き起こし得ると述べていた
- MCP の台頭により、Playwright や Selenium のような主要なUIテストフレームワークが独自のMCPサーバー(playwright-mcp、mcp-selenium)を導入している
- ネイティブ技術によって信頼性の高いブラウザ自動化を提供することで、コーディングアシスタントがPlaywrightまたはSeleniumで信頼できるUIテストを生成できる
- 最新のPlaywrightリリースにおける Playwright Agents のような動向に期待しており、より実用的なガイダンスと現場での経験が現れることを見込んでいる
12. コーディングエージェントをリファレンスアプリケーションにアンカーする
- 過去に tailored service templates パターンを blip として取り上げており、これはマイクロサービスを採用する組織が新しいサービスをブートストラップし、既存インフラとシームレスに統合するのに役立った
- 時間の経過とともに新しい依存関係、フレームワーク、アーキテクチャパターンが登場し、これらのテンプレートと既存サービスの間でコードドリフトが増加する傾向がある
- コーディングエージェントの時代において、優れた実践とアーキテクチャの一貫性を維持するために anchoring coding agents to a reference application を実験
- Model Context Protocol (MCP) サーバーが参照テンプレートコードとコミット diff の両方を公開し、エージェントがドリフトを検知して修復提案を行える
13. コンテキストエンジニアリング
- 推論中に LLM に提供される情報を体系的に設計・最適化し、望ましい出力を安定して生成する
- プロンプト、検索されたデータ、メモリ、指示、環境シグナルのようなコンテキスト要素の構造化、選択、順序付けを含む
- プロンプトの文言だけに焦点を当てる prompt engineering とは異なり、context engineering はコンテキスト全体の構成を考慮する
- 今日のエンジニアは、3つの領域にグループ化できるさまざまな個別技術を使用している: Context setup、長期タスクのための Context management、Dynamic information retrieval
14. フォワードエンジニアリングのための GenAI
- AI が生成したレガシーコードベースの説明を通じてレガシーシステムをモダナイズする新興技術
- レガシーコードが何をしているか(仕様)に焦点を当てた明示的な段階を導入しつつ、現在の実装方法は意図的に隠す
- spec-driven development と関連するが、特にレガシーのモダナイゼーションに適用される
- reverse-engineering → design/solutioning → forward-engineering のループに沿って、人間と AI エージェントの両方が実装にコミットする前に、より高いレベルで推論できる
15. LLM のためのデータアクセスパターンとしての GraphQL
- context engineering を強化する、均一でモデルフレンドリーなデータアクセスレイヤーを作るための新興アプローチ
- モデルにデータベースへの直接アクセス権を与えずに、構造化されクエリ可能なデータを公開できる
- 各ユースケースごとに新しいエンドポイントやフィルターが必要な REST API とは異なり、GraphQL はモデルが必要なデータだけを取得できる
- 明確に定義された GraphQL スキーマは、LLM が利用可能なエンティティと関係について推論するために使えるメタデータを提供する
16. ナレッジストックよりナレッジフロー
- 「チーム間の情報共有の方法をどう改善するか」という質問をよく受ける
- システム思考から借用した視点である knowledge flows and knowledge stocks の概念が有用
- 組織の知識をシステムとして見ることを促す。ストックは蓄積された知識を表し、フローは知識が組織内を移動し進化する方法を表す
- 外部知識のフローを組織へ増やすとイノベーションを促進する傾向があり、communities of practice を設立することはフローを改善する実証済みの方法である
17. 判定者としての LLM
- LLM を判定者として使い、他のシステム(通常は LLM ベースの生成器)の出力を評価する手法は、生成 AI におけるスケーラブルで自動化された評価を提供する可能性により注目されている
- 新たに認識された複雑さとリスクを反映し、この blip を Trial から Assess に移動
- 評価は position bias、verbosity bias、低い頑健性に弱く、さらに深刻な問題として scaling contamination がある
- これらの欠陥に対処するため、LLMs as a jury(合意形成のために複数モデルを使用)や、評価時の chain-of-thought 推論のような改善技術を探求している
18. オンデバイス情報検索
- 検索、コンテキスト認識、retrieval-augmented generation (RAG) を完全にユーザーのデバイス(モバイル、デスクトップ、またはエッジデバイス)上で実行できるようにする技術
- プライバシーと計算効率を優先し、軽量なローカルデータベースとオンデバイス推論向けに最適化されたモデルを組み合わせる
- 有望な実装としては、sqlite-vec(埋め込みデータベース内でベクトル検索をサポートする SQLite 拡張)と EmbeddingGemma(Gemma 3 アーキテクチャベースの3億パラメータ埋め込みモデル)の組み合わせがある
- ローカルファーストのアプリケーションや、データ主権、低レイテンシ、プライバシーが重要なその他のユースケースでの評価を推奨
19. SAIF
- SAIF (Secure AI Framework) は、Google が AI セキュリティリスク管理のための実践的ガイドを提供するために開発したフレームワーク
- データ汚染やプロンプトインジェクションのような一般的脅威を、明確なリスクマップ、コンポーネント分析、実践的な緩和戦略を通じて体系的に扱う
- エージェントシステム構築における進化するリスクへの焦点は、特に時宜を得ており価値がある
- LLM の利用および AI ベースアプリケーションのセキュリティ実践を強化するために使える、簡潔で実行可能なプレイブックを提供する
20. サイドカーなしのサービスメッシュ
- サイドカーベースのサービスメッシュのコストと運用の複雑さが続く中、Istio ambient mode のようなサイドカー不要のサービスメッシュオプションの登場に期待している
- Ambient mode は、2つの主要コンポーネント間で関心事を分離するレイヤードアーキテクチャを導入する: ノードごとの L4 プロキシ(ztunnel)とネームスペースごとの L7 プロキシ(Waypoint proxy)
- ztunnel は、L3 および L4 トラフィックが効率的かつ安全に転送されることを保証し、ノード上のすべての ID に対する証明書の取得と、ambient 対応ワークロードへのトラフィックリダイレクトを処理する
- Waypoint proxy は任意の ambient mode コンポーネントであり、トラフィック管理、セキュリティ、可観測性といった、より豊富な Istio 機能を有効にする
21. Small language models
- 複数の Technology Radar の巻にわたり、small language models (SLMs) の着実な進化を観察
- エージェントソリューション構築への関心の高まりにより、SLM がエージェント AI を効率的に駆動できることを示す証拠が増加
- 現在のエージェントワークフローの大半は、高度な推論を必要としない狭く反復的な作業に焦点を当てており、SLM に適している
- Phi-3、SmolLM2、DeepSeek のような SLM の継続的な進歩により、こうした作業に十分な機能を提供
22. Spec-driven development
- AI 支援コーディングワークフローにおける新興アプローチであり、この用語の定義は今なお進化中
- 一般的には、構造化された機能仕様から始め、その後複数の段階を経て、より小さな要素、ソリューション、タスクへと分解していくワークフローを指す
- Amazon の Kiro は、要件、設計、タスク生成という 3 つのワークフローステップへユーザーを導く
- GitHub の spec-kit は同様の 3 段階プロセスに従うが、より豊富なオーケストレーション、設定可能なプロンプト、常に従うべき不変の原則を定義する「constitution」が追加されている
23. Team of coding agents
- 開発者が複数の AI コーディングエージェントをオーケストレーションする手法で、それぞれが architect、back-end specialist、tester のような固有の役割を持つ
- Claude Code、Roo Code、Kilo Code のようなツールが、サブエージェントと複数の動作モードをサポート
- LLM に特定の役割とペルソナを割り当てると出力品質が向上するという実証済みの原則に基づき、単一の汎用エージェントに依存するのではなく、複数の役割別エージェントを調整することでより良い結果を達成
- オーケストレーションされた多段階の AI 支援開発パイプラインへの移行を示している
24. Topology-aware scheduling
- GPU や LPU はもはや独立したデバイスではなく、性能が配置やトポロジーに左右される密結合のアクセラレータネットワークである
- NVIDIA の NVL72 のようなラックスケールシステムでは、72 基の GPU が 13TB 超の VRAM を共有し単一アクセラレータとして動作するが、ワークロードがスイッチアイランドをまたぐと集団演算がボトルネックに変わる
- Groq のコンパイル時ソフトウェアスケジューリング型アーキテクチャは決定論的なデータ移動を前提としており、ランダムなスケジューリングはこの前提と予測可能性を破壊する
- トポロジーを無視する素朴なスケジューラは、マルチ GPU ワークロードをしばしば無作為に分散させ、ステップ時間と効率の低下を招く
25. Toxic flow analysis for AI
- MCP の S は「security」を意味するというおなじみのジョークは、きわめて現実的な問題を覆い隠している
- エージェントがツール呼び出しや API 呼び出しを通じて相互に通信するとき、lethal trifecta として知られるものにすぐに遭遇しうる。すなわち、個人データへのアクセス、信頼できないコンテンツへの露出、外部通信能力である
- この 3 つをすべて備えたエージェントは非常に脆弱であり、LLM は入力内の指示に従う傾向があるため、信頼できないソースからデータ流出を指示する内容が含まれていると、容易にデータ漏えいにつながりうる
- toxic flow analysis は、エージェントシステムのフローグラフを検査し、追加調査のための潜在的に安全でないデータ経路を特定する
Hold
26. AI-accelerated shadow IT
- AI は、ノンコーダーが IT 部門を待たずに自らソフトウェアを構築・統合できるようにする障壁を下げている
- これが解き放つ可能性には期待している一方で、AI-accelerated shadow IT の初期兆候には警戒している
- ノーコードのワークフロー自動化プラットフォームは、いまや AI API 統合(OpenAI や Anthropic など)をサポートしており、AI をダクトテープのように使って、以前は不可能だった統合をつなぎ合わせる誘惑がある
- 同時に、AI コーディングアシスタントはよりエージェント化が進み、基本的な教育を受けたノンコーダーでも社内ユーティリティアプリケーションを構築できるようになっている
27. Capacity-driven development
- 現代のソフトウェア開発プラクティスの成功の鍵は、作業フローへの焦点を維持することにある
- Stream-aligned チームは、ユーザージャーニーやプロダクトのような単一の価値あるフローに集中することで、エンドツーエンドの価値を効率的に提供する
- しかし、このように整列されたチームが余剰キャパシティを持つとき、他のプロダクトやストリームの機能を引き受ける capacity-driven development へ向かう憂慮すべき傾向が観察されている
- 短期的には効率的に見えるかもしれないが、需要急増への対応に最適化されたローカル最適であり、常態化すると認知負荷と技術的負債が増大する
28. Complacency with AI-generated code
- AI コーディングアシスタントとエージェントが注目を集めるなか、complacency with AI-generated code への懸念を強調するデータや研究が増えている
- こうしたツールが開発を加速しうることを示す十分な証拠はあるが、研究は時間の経過とともにコード品質が低下しうることを示している
- GitClear の 2024 research では、重複コードとコード churn が予想以上に増加した一方、コミット履歴におけるリファクタリング活動は減少した
- Microsoft によるナレッジワーカー対象の research は、AI による自信の高まりがしばしば批判的思考を犠牲にして現れることを示している
29. Naive API-to-MCP conversion
- 組織には、内部 API を Model Context Protocol (MCP) へシームレスかつ直接的に変換し、AI エージェントが既存システムと相互作用できるようにしたいという強い意欲がある
- MCP link や FastAPI-MCP のようなツールの数が増えており、この変換を支援しようとしている
- このような naive API-to-MCP conversion には反対である。API は通常、人間の開発者向けに設計されており、AI がそれらをつなぎ合わせる際には、過剰なトークン消費、コンテキスト汚染、エージェント性能の低下につながりうる細粒度の原子的な操作で構成されている
- こうした API は、特に内部 API の場合、機密データを露出させたり破壊的な操作を許したりすることが多い
30. 独立したデータエンジニアリングチーム
- 提供するストリーム処理のビジネスドメインとは別に、データパイプラインやプロダクトを開発・所有する独立したデータエンジニアリングチームを組織することは、非効率と弱いビジネス成果につながるアンチパターン
- この構造は、DevOps・テスト・デプロイ機能を分離した過去の失敗を繰り返すものであり、知識のサイロ、ボトルネック、労力の無駄を生む
- 緊密な協業がない場合、データエンジニアは意味のあるデータプロダクト設計に必要なビジネスおよびドメインの文脈を欠くことが多く、その結果、採用と価値の両方が制限される
- 代わりに、データプラットフォームチームは共有インフラの維持に注力し、クロスファンクショナルなビジネスチームが data mesh の原則に従って自らの data products を構築・所有すべき
31. Text to SQL
- Text to SQL はLLMを使って自然言語を実行可能なSQLに変換するが、信頼性は期待に届かないことが多い
- 監督されていないワークフローでの利用を推奨しないため、このブリップをHoldに移動。たとえば、出力が隠蔽される場合や、自動化されたユーザー生成クエリを動的に変換する場合など
- このようなケースでは、LLMはスキーマやドメイン理解が限定的であるためにしばしばハルシネーションを起こし、誤ったデータ取得や意図しないデータ変更のリスクを生む
- エージェント型ビジネスインテリジェンスでは、データベースへの直接アクセスは避け、代わりに Cube や dbt's semantic layer のような管理されたデータ抽象化セマンティックレイヤーを使うべき
[Platforms]
Adopt
32. Arm in the cloud
- クラウドにおける Arm compute instances は、従来のx86ベースのインスタンスと比べたコスト効率とエネルギー効率の高さから、近年ますます人気を集めている
- AWS、Azure、GCP を含む主要クラウドプロバイダーは、現在では強力なArmオプションを提供している
- 多くのチームが、マイクロサービス、オープンソースデータベース、さらには高性能コンピューティングのようなワークロードを、最小限のコード変更とわずかなビルドスクリプト調整だけでArmへ移行することに成功している
- multi-arch Docker images のような最新ツールにより、Armとx86の両環境でのビルドとデプロイが簡素化されている
Trial
33. Apache Paimon
- Apache Paimon は、lakehouse architecture を実現できるよう設計されたオープンソースのデータレイク形式
- Flink や Spark のような処理エンジンとシームレスに統合され、ストリーミングとバッチ処理の両方をサポートする
- Paimonアーキテクチャの主な利点は、標準的なデータレイク形式と LSM (log-structured merge tree) 構造の融合にある
- この組み合わせにより、データレイクにおける高性能な更新と低レイテンシ読み取りという従来の課題を解決する
34. DataDog LLM Observability
- Datadog LLM Observability は、大規模言語モデルおよびエージェントアプリケーションのワークフローに対してエンドツーエンドのトレーシング、監視、診断を提供する
- 各プロンプト、ツール呼び出し、中間ステップをスパンとトレースにマッピングし、レイテンシ、トークン使用量、エラー、品質メトリクスを追跡するとともに、Datadogの広範なAPMおよび可観測性製品群と統合される
- すでにDatadogを利用していてそのコスト構造に慣れている組織であれば、対象ワークロードを計装できることを前提に、LLM可観測性機能がAIワークロードの可視性を得るための直感的な方法だと分かるはずだ
- LLMの計装の設定と利用には注意と、ワークロードおよび実装に対する確かな理解が必要であり、導入時にはデータエンジニアと運用担当者の緊密な協力が推奨される
35. Delta Sharing
- Delta Sharing は、DatabricksとLinux Foundationが開発した、安全なクロスプラットフォームデータ共有のためのオープン標準およびプロトコル
- クラウドに依存せず、組織はデータをコピーまたは複製することなく、クラウドプロバイダー間およびオンプレミス拠点でライブデータを共有できる
- シンプルなREST APIを使って、受信者が pandas、Spark、Power BI のようなツールで大規模データセットを取得できるよう、短期間有効な事前署名URLを発行する
- データテーブル、ビュー、AIモデル、ノートブックの共有をサポートし、強力な集中型ガバナンスと監査を提供する
36. Dovetail
- Dovetail platform は、分散した定性的調査データの管理という継続的な課題を解決する
- ユーザーインタビュー、文字起こし、インサイトのための集中リポジトリを提供し、生データを構造化され分析可能な資産へと変換する
- プロダクトディスカバリーのワークフローでは特に、顧客の引用や統合されたテーマをプロダクト仮説や予想ROIに直接結びつけるエビデンストレースの作成に非常に有用
- そうすることで、Dovetailはプロダクト意思決定における定性的データの役割を強化する
37. Langdock
- Langdock は、組織が社内運用向けの生成AIエージェントやワークフローを開発・実行するためのプラットフォーム
- 社内チャットアシスタント、複数のLLMに接続するためのAPIレイヤー、Slack、Confluence、Google Drive のようなシステムと統合するエージェントワークフロー構築ツールを備えた統合環境を提供する
- このプラットフォームは、エンタープライズ向けコンプライアンス基準を備えたオンプレミスおよびEUホスティングのオプションを提供し、データ主権を重視している
- Langdockを導入する組織は依然としてデータガバナンスに細心の注意を払う必要があり、toxic flow analysis のような手法を使って lethal trifecta を防ぐべき
38. LangSmith
- LangSmith は、LangChainチームによるホスティングプラットフォームで、LLMアプリケーションに対する可視性、追跡、評価を提供する
- チェーン、ツール、プロンプトの詳細なトレースを取得し、チームがモデルの挙動をデバッグ・測定し、性能劣化を追跡し、評価用データセットを管理できるようにする
- LangSmithは、non-LangChainワークフローへのサポートが限定的なプロプライエタリなSaaSプラットフォームであり、このエコシステムにすでに投資しているチームにとって最も魅力的
- プロンプト評価と実験に対する統合サポートは、Langfuse のようなオープンソースの代替よりも、とりわけ洗練されている
39. Model Context Protocol (MCP)
- Model Context Protocol (MCP) は、LLMアプリケーションおよびエージェントが外部データソースやツールと統合する方法を定義するオープン標準
- MCP は、コンテキストとツールアクセスに焦点を当てており、エージェント間通信を管理する Agent2Agent (A2A) プロトコルとは区別される
- 前回のブリップ以降、MCP の採用が急増し、JetBrains(IntelliJ)や Apple のような主要企業が、FastMCP のような新興フレームワークとともにエコシステムに参加
- プレビュー版の MCP Registry 標準は、公開ツールおよび独自ツールの検出をサポートするようになった
40. n8n
- n8n は、Zapier や Make(旧 Integromat)に似た fair-code ライセンスのワークフロー自動化プラットフォームだが、セルフホスティング、拡張性、コードによる制御が可能な選択肢を求める開発者向けに構築されている
- Apache Airflow よりもワークフロー作成に対してローコードで視覚的なアプローチを提供しつつ、JavaScript または Python のカスタムコードもサポート
- 主なユースケースは、複数のサービスを自動化ワークフローに統合することだが、LLM を構成可能なデータソース、メモリ、ツールに接続することもできる
- 多くのチームが n8n を使って、チャットアプリケーションや Webhook でトリガーされるエージェントワークフローをすばやくプロトタイプしており、import/export 機能を活用して AI 支援でワークフローを生成することも多い
41. OpenThread
- OpenThread は、Google が開発した Thread ネットワーキングプロトコルのオープンソース実装
- IPv6、6LoWPAN、LR-WPAN などのネットワークレイヤーを含む Thread 仕様の主要機能をすべて備え、デバイスがノードおよびボーダールーターとして動作できるメッシュネットワーク機能をサポート
- OpenThread は、ベンダーが独自の無線機能や暗号化機能を統合できる柔軟な抽象化レイヤーと統合フックを活用し、幅広いハードウェアプラットフォームで動作する
- この成熟したプロトコルは商用製品で広く利用されており、経験上、バッテリー駆動の低消費電力デバイスから大規模なメッシュセンサーネットワークまで、さまざまな IoT ソリューションの構築に信頼できる
Assess
42. AG-UI Protocol
- AG-UI は、リッチなユーザーインターフェースとエージェント間通信を標準化するために設計されたオープンプロトコルおよびライブラリ
- 直接ユーザーと対話するエージェントに焦点を当てつつ、ミドルウェアおよびクライアント統合を通じてあらゆるフロントエンドとバックエンドに一般化されている
- このプロトコルは、バックエンドエージェントがフロントエンドアプリケーションと通信する一貫した方法を定義し、AI と人間ユーザーの間でリアルタイムのステートフルな協調作業を可能にする
- SSE や WebSockets を含む複数のトランスポートプロトコルをサポートし、エージェント実行のさまざまな状態を表す標準化されたイベントタイプを提供
43. Agent-to-Agent (A2A) Protocol
- Agent2Agent (A2A) は、複雑なマルチエージェントワークフローにおけるエージェント間の通信と相互作用の標準を定義するプロトコル
- Agent Cards を用いて、機能の発見と伝達、セキュリティスキームの仕様を含む、エージェント間通信の中核要素を記述する
- A2A は、エージェントの状態、メモリ、内部構造などの内部詳細を公開せずにエージェント間通信に焦点を当てることで、Model Context Protocol (MCP) を補完する
- このプロトコルは、長時間実行タスクに対する非同期優先アプローチ、段階的更新のためのストリーミング応答、HTTPS・認証・認可を用いた安全な転送といったベストプラクティスを促進する
44. Amazon S3 Vectors
- Amazon S3 Vectors は、S3 オブジェクトストレージをネイティブなベクトル機能で拡張し、組み込みのベクトル保存および類似検索機能を提供する
- Amazon Bedrock や OpenSearch を含む AWS エコシステムとシームレスに統合され、メタデータフィルタリングや IAM によるガバナンスなどの追加機能も提供
- 依然としてプレビュー段階で制約はあるものの、その価値提案は魅力的であり、このコスト効率が高くアクセスしやすいベクトルストレージのアプローチは、大量データを扱い、低レイテンシが主な関心事ではないさまざまなアプリケーションに適している
45. Ardoq
- Ardoq は、組織が将来をより効果的に計画できるよう、アーキテクチャ知識基盤を構築・管理・拡張できるエンタープライズアーキテクチャ(EA)プラットフォーム
- ドリフトやサイロ化を起こしがちな従来の静的ドキュメントとは異なり、Ardoq のデータ駆動型アプローチは既存システムから情報を取り込み、環境の変化に応じて最新状態を維持する動的なナレッジグラフを生成する
- 特に有用な機能は、Git に似たブランチおよびマージのアプローチを用いて、what-if の将来状態を視覚的にモデリングし定義できる Ardoq Scenarios
- アーキテクチャ変革を進める組織は、このプロセスを簡素化し加速する可能性を考慮して、Ardoq のような専用 EA プラットフォームを評価すべきである
46. CloudNativePG
- CloudNativePG は、Kubernetes 上で高可用性 PostgreSQL クラスタのホスティングと管理を簡素化する Kubernetes Operator
- PostgreSQL のようなステートフルサービスを Kubernetes 上で実行することは、Kubernetes と PostgreSQL レプリケーションの両方に対する深い知識を要するため複雑になりがち
- CloudNativePG は、PostgreSQL クラスタ全体を単一の構成可能な宣言的リソースとして扱うことで、この複雑さの大半を抽象化する
- ネイティブなストリーミングレプリケーションによるシームレスな primary/standby アーキテクチャを提供し、自己修復機能、最も同期が取れているレプリカを昇格させる自動フェイルオーバー、障害が発生したレプリカの自動再作成を含む高可用性機能をすぐに利用できる
47. Coder
- Coder は、先に説明した development environments in the cloud プラクティスに沿って、標準化されたコーディング環境を迅速にプロビジョニングするプラットフォーム
- Gitpod(現在は Ona にリブランディング)や GitHub Codespaces のような類似ツールと比べて、Coder は Terraform を通じたワークステーションのカスタマイズに対してより大きな制御を提供する
- ベンダーのサーバーではなく、クラウドまたはデータセンター内の自社インフラ上でワークステーションをホストする
- このアプローチは、AI コーディングエージェントの実行や社内システムへのアクセス機能を含め、より高い柔軟性をもたらす
48. Graft
- Graft は、エッジおよび分散環境において、強い一貫性と効率的なデータ同期を実現するトランザクションストレージエンジン
- lazy replication を用いて必要なときにだけデータを同期し、partial replication で帯域消費を最小限に抑え、serializable snapshot isolation によりデータ整合性を保証する
- 類似のユースケースとして Radar では Electric に言及しているが、Graft はデータ形式を強制せず、一貫性のあるページレベル更新をサポートするトランザクションシステムへとオブジェクトストレージを変換する点がユニーク
- ローカルファーストのモバイルアプリケーションの基盤、複雑なクロスプラットフォーム同期の管理、サーバーレスまたは組み込みシステムにおけるステートレスレプリカのバックボーンとして適している
49. groundcover
- groundcover は、ログ、トレース、メトリクス、Kubernetes イベントを単一の画面に統合するクラウドネイティブ可観測性プラットフォーム
- eBPF を活用し、アプリケーションコードにエージェントや SDK を挿入することなく、ゼロコード計測で詳細な可観測性データを取得
- groundcover の eBPF センサーは、監視対象の各クラスターの専用ノードで実行され、観測対象アプリケーションとは独立して動作
- 主な機能には、カーネルレベルの深い可視性、データプライバシーのための bring-your-own-cloud (BYOC) architecture、コストを予測可能に保つデータ量非依存の料金モデルが含まれる
50. Karmada
- Karmada("Kubernetes Armada")は、複数の Kubernetes クラスター、クラウド、データセンターにまたがってワークロードをオーケストレーションするプラットフォーム
- 現在、多くのチームは Flux や ArgoCD のような GitOps ツールとカスタムスクリプトを組み合わせてクラスター全体にデプロイしており、専用ソリューションは歓迎される
- Karmada は Kubernetes ネイティブ API を活用するため、クラウドネイティブ環境向けにすでに構築されたアプリケーションを変更する必要がない
- マルチクラウド管理、高可用性、障害復旧、トラフィックスケジューリングのための高度なスケジューリング機能を提供
51. OpenFeature
- ビジネスが拡大するにつれて、feature flag の管理はしばしばますます複雑になり、チームは最も単純な feature toggle を超える抽象化レイヤーを必要とする
- OpenFeature は、feature flag の定義と利用の方法を標準化するベンダー中立かつコミュニティ主導の API 仕様を通じて、このレイヤーを提供する
- CLI は、環境変数またはインメモリ設定を使った基本構成から、ConfigCat や LaunchDarkly のような成熟したプラットフォームまで、複数のスキーマ定義を幅広くサポートする
- ただし、重要な注意点が 1 つ残っている。チームは、フラグの氾濫、アプリケーションの複雑化、過剰なテストオーバーヘッドを避けるため、flag のさまざまな categories of flags を分けて、かつ規律を持って管理しなければならない
52. Oxide
- プライベートインフラの構築と運用は複雑であり、これがパブリッククラウドが大半の組織でデフォルトとなっている主な理由の 1 つ
- しかし、それを必要とする人々に向けて、Oxide はハードウェアとソフトウェアをゼロから組み立てて統合する代替手段を提供
- 完全に統合されたシステムソフトウェアを実行するコンピューティング、ネットワーキング、ストレージを備えた事前構築済みラックを提供
- チームは Terraform やその他の自動化ツールを用いて、Oxide の IaaS API を通じてリソースを管理できる。Oxide はこれをオンプレミスの弾力的インフラと呼んでいる
53. Restate
- Restate は、状態を持つ耐障害性アプリケーションを構築する際の複雑な分散システム課題を解決するために設計された durable execution プラットフォーム
- 実行ジャーナリングによってすべてのステップを記録し、耐障害性、信頼できる復旧、サービス間の exactly-once 通信を保証
- このプラットフォームの主要なアーキテクチャ上の利点は、アプリケーションロジックを 3 つの durable service タイプに分離している点にある。ステートレス関数向けの Basic Services、並行するステートフルエンティティをモデル化する Virtual Objects、複雑な多段階プロセスをオーケストレーションする Workflows
- 大規模な保険システムで Restate を慎重に評価しており、これまでのところ性能には非常に満足している
54. SkyPilot
- SkyPilot は、オンプレミスまたはクラウドで AI ワークロードを実行・拡張するためのオープンソースプラットフォーム
- UC Berkeley の Sky Computing Lab で開発された SkyPilot は、インテリジェントなブローカーとして機能し、主要クラウドや Kubernetes クラスターで最も安価かつ利用可能な GPU を自動的に見つけてプロビジョニングすることで、しばしばコンピューティングコストを削減する
- インフラチームにとっては、Slurm のような使いやすさ、クラウドネイティブな堅牢性、Pod への直接 SSH アクセス、ギャングスケジューリングやマルチクラスター対応といった機能を提供し、Kubernetes 上での AI 実行を単純化する
- 学習または推論ワークロードのシームレスなスケールを支援
55. StarRocks
- StarRocks は、従来の OLAP システムの速度と現代的なデータレイクハウスの柔軟性を組み合わせ、リアルタイムビジネスインテリジェンスを再定義する分析データベース
- SIMD 最適化実行エンジン、カラムストア、洗練されたコストベースオプティマイザにより、大規模環境で 1 秒未満のクエリレイテンシを実現
- この高性能アーキテクチャにより、ユーザーは事前計算やデータコピーなしに、Apache Iceberg のようなオープンデータ形式上で直接複雑な分析を実行できる
- この分野には多くのプラットフォームがあるが、StarRocks は極端な同時実行性と一貫して最新のデータ鮮度の両方を求める場合に、コスト効率の高いソリューションとして有力な候補と見ている
56. Uncloud
- Uncloud は、開発者が Docker Compose アプリケーションを本番環境へ持ち込めるようにする軽量なコンテナオーケストレーションおよびクラスタリングツール
- Kubernetes の運用オーバーヘッドなしに、シンプルでクラウドのような体験を提供
- 通信のための安全な WireGuard メッシュネットワークを自動構成し、Caddy リバースプロキシを使って自動 HTTPS とロードバランシングを提供することで、マシン間スケーリングと無停止デプロイを実現
- Uncloud の主要なアーキテクチャ上の利点は、完全分散型の設計により中央コントロールプレーンの必要性をなくし、個々のマシンがオフラインになってもクラスターの機能的な稼働を維持できるよう保証する点にある
[Tools]
Adopt
57. ClickHouse
- ClickHouse は、リアルタイム分析向けのオープンソース分散カラム指向オンライン分析処理(OLAP)データベース
- 大規模データ分析を処理できる、非常に高性能でスケーラブルなエンジンとして成熟している
- 増分マテリアライズドビュー、効率的なクエリエンジン、強力なデータ圧縮により、対話型クエリに最適
- 近似集計関数の組み込みサポートにより、精度と性能のトレードオフが可能であり、これは高カーディナリティ分析で特に有用
58. NeMo Guardrails
- NeMo Guardrails は、NVIDIA のオープンソースツールキットで、LLM ベースの対話型アプリケーションにプログラム可能な安全性と制御メカニズムを簡単に追加できる
- 動作ルールを定義して適用することで、出力が安全で、話題に沿っており、規制を順守するよう保証する
- 開発者は、柔軟な会話フローを作成し、会話を管理し、事前定義された経路と運用手順を適用するために、専用言語である Colang を使用する
- NeMo Guardrails は、性能のための async-first API を提供し、コンテンツ安全性、セキュリティ、入出力制御のためのガードレールをサポート
59. pnpm
- 前回のRadar以降、チームからpnpmに関する好意的なフィードバックが引き続き寄せられている
- pnpmは、速度とディスク容量効率の両面で代替手段に比べて大幅な性能向上を提供するNode.jsパッケージマネージャー
- 複数プロジェクトの
node_modulesフォルダー内の重複パッケージをディスク上の単一の場所にハードリンクし、増分ファイルレベル最適化をサポートすることで、さらに性能を向上させる - pnpmは、最小限の互換性問題で大幅に高速なフィードバックループを提供するため、Node.jsパッケージ管理のデフォルトの選択肢となっている
60. Pydantic
- Pydanticは、標準の型ヒントを使用してデータモデルを定義し、実行時にデータスキーマを強制するPythonライブラリ
- もともと型アノテーションは静的解析のためにPythonに追加されたが、その多様性の拡大により、実行時検証を含むより広範な用途へとつながっている
- 高速なRustコアを基盤として構築されており、効率的なデータ検証、パース、シリアライズを提供する
- LLMアプリケーションでは不可欠な存在となっており、一般にstructured output from LLMs技法を使ってLLMの予測不能な性質を管理する
Trial
61. AI Design Reviewer
- AI Design Reviewerは、デザイン監査やヒューリスティック評価を実施し、既存または新規デザインに対する実行可能なフィードバックを収集するためのFigmaプラグイン
- 監査では、UX批評、UIの不整合、アクセシビリティのギャップ、コンテンツ品質、エッジケースのシナリオを扱う
- 問題の特定に加え、共有されたデザイン語彙やデザイン上の選択の背後にある根拠をチームが構築するのに役立つ、ドメイン認識型の推奨事項を提供する
- チームはAI Design Reviewerを使ってレガシーデザインを分析し、維持すべきポジティブな体験と解消すべきネガティブな体験を特定することで、再設計のためのUX目標に情報を与えている
62. Barman
- Barman(Backup and Recovery Manager)は、PostgreSQLサーバーのバックアップと災害復旧を管理するオープンソースツール
- さまざまな方法による物理バックアップの作成を簡素化し、包括的なカタログとして整理し、ポイントインタイムリカバリ機能でライブサーバーにバックアップを復元するなど、災害復旧プロセス全体を支援する
- Barmanは堅牢で使いやすく、移行作業中のポイントインタイムリカバリ操作の速度には深い感銘を受けた
- 定期バックアップにも十分に対応しており、スケジューリングと保持に関する複雑で混在した構成を処理する能力を備えている
63. Claude Code
- AnthropicのClaude Codeは、複雑な多段階ワークフローを計画・実装するための自然言語インターフェースとエージェント実行モデルを提供する、エージェント型AIコーディングツール
- 登場から1年も経っていないが、Thoughtworksの内外の開発者にすでに広く採用されており、Trialに配置された
- OpenAIのCodex CLI、GoogleのGemini CLI、オープンソースのOpenCodeのようなコンソールベースのコーディングエージェントが登場し、Cursor、Windsurf、GitHub CopilotのようなIDEベースのアシスタントも現在はエージェントモードを備えている
- チームがこれを、コードの作成や修正だけでなく、仕様、ストーリー、設定、インフラ、ドキュメントを管理するための汎用AIエージェントとして使っているのを見ている
64. Cleanlab
- データ中心AIというパラダイムでは、データセット品質の改善はしばしば、モデル自体をチューニングするよりも大きな性能向上をもたらす
- Cleanlabはこの問題に対処するよう設計されたオープンソースのPythonライブラリで、テキスト、画像、表形式、音声のデータセットにおける誤ラベル、外れ値、重複といった一般的なデータ問題を自動で特定する
- confident learningの原則に基づいて構築されたCleanlabは、モデル予測確率を活用してラベルノイズを推定し、データ品質を定量化する
- このモデル非依存のアプローチにより、開発者はデータセットの誤りを診断・修正し、その後、堅牢性と精度を改善するためにモデルを再訓練できる
65. Context7
- Context7は、AI生成コードの不正確さに対処するMCPサーバー
- LLMが古い学習データに依存する一方で、Context7は、プロジェクトで使われているライブラリやフレームワークについて、正確で最新かつバージョンごとのコードを生成できるようにする
- フレームワークのソースリポジトリから最新のドキュメントと機能するコード例を直接取得し、プロンプト時点でLLMのコンテキストウィンドウに注入する
- 経験上、Context7はコードのハルシネーションと古い学習データへの依存を大幅に減らす
66. Data Contract CLI
- Data Contract CLIは、Data Contract仕様の作業向けに設計されたオープンソースのコマンドラインツール
- データ契約の作成と編集を可能にし、さらに重要なこととして、データを契約に照らして検証できるため、データプロダクトの完全性と品質を確保するうえで不可欠
- このCLIは、複数のスキーマ定義(Avro、SQL DDL、Open Data Contract Standardなど)に対する幅広いサポートを提供し、さまざまな契約バージョンを比較して破壊的変更を即座に検出できる
- 特にデータメッシュ領域において、CI/CD統合を通じてデータプロダクト間の契約ガバナンスを運用化するのに有用であることが分かった
67. Databricks Assistant
- Databricks Assistantは、Databricksプラットフォームに直接統合されたAIベースの対話型ツールで、データ専門家向けのコンテキスト対応ペアプログラマーとして機能する
- 汎用コーディングアシスタントとは異なり、Unity Catalogのメタデータを含むDatabricks環境とデータコンテキストに関する組み込みの理解という利点がある
- Assistantはコードスニペットの生成を超えて、複雑な多段階のSQLおよびPythonクエリを作成し、エラーを診断し、詳細でワークスペース固有の説明を提供できる
- すでにDatabricksエコシステムに投資している組織にとっては、生産性を加速し、複雑なデータ作業への参入障壁を下げることができる
68. Hoppscotch
- Hoppscotchは、APIの開発、デバッグ、テスト、共有のための軽量なオープンソースツール
- HTTP、GraphQL、WebSocketを含む複数のプロトコルをサポートし、Web、デスクトップ、CLI環境向けのクロスプラットフォームクライアントを提供する
- APIツールの領域はPostman、Insomnia、Brunoのような代替手段で混み合っているが、Hoppscotchは軽量なフットプリントとプライバシーに配慮した設計で際立っている
- 分析機能を省略し、ローカルファーストのストレージを使用し、セルフホスティングをサポートすることで、強力なデータプライバシーを維持しながらAPIスクリプトを共有する直感的な方法を求める組織にとって有力な選択肢となる
69. NVIDIA DCGM Exporter
- NVIDIA DCGM Exporterは、チームが分散GPUトレーニングを大規模に監視するのに役立つオープンソースツール
- NVIDIA Data Center GPU Manager(DCGM)の独自テレメトリを、標準的な監視システムと互換性のあるオープン形式に変換する
- GPU利用率、温度、電力、ECCエラー数といった重要なリアルタイムメトリクスを、GPUおよびホストサーバーの両方について公開する
- この可視性は、カスタムLLMをファインチューニングしたり、長時間実行されるGPU集約型トレーニングジョブを運用したりする組織にとって不可欠である
70. RelationalAI
- 大量の多様なデータをSnowflakeに取り込むと、そのデータ内の固有の関係や暗黙のルールが曖昧になる可能性がある
- Snowflake Native Appとして構築されたRelationalAIは、チームが意味のある概念を捉え、中核となるビジネスエンティティを定義し、Snowflakeテーブルに対して直接複雑なロジックを組み込む高度なモデルを構築できるようにする
- 強力なGraph Reasonerにより、ユーザーはこれらのモデルを基に関係知識グラフを生成、分析、可視化できる
- 大規模で急速に変化するデータセットを管理する組織にとって、知識グラフの構築は事前モニタリングや、より豊かで実行可能なインサイトの生成に不可欠となる可能性がある
71. UX Pilot
- UX Pilotは、ワイヤーフレーミングから高忠実度のビジュアルデザイン、レビューに至るまで、UXデザインプロセスの複数段階を支援するAIツール
- テキストまたは画像の入力を受け取り、自動的に画面、フロー、レイアウトを生成できる
- Autoflow機能はユーザーフローの遷移を生成し、Deep Designはより豊かで詳細な出力を生成する
- UX Pilotには、標準的なデザインツール内でのブラッシュアップのために、生成したデザインを書き出せるFigmaプラグインも含まれる
72. v0
- v0は、Radarで最後に紹介されて以来進化している
- 現在は、プロダクトマネージャーがセルフサービスでUIプロトタイプをより簡単に生成・調整できるデザインモードを備える
- 最新リリースでは、大きなコンテキストウィンドウとマルチモーダル機能を備えた独自モデルを導入し、v0がテキストと視覚入力の両方からUIを生成・改善できるようになった
- もう1つの注目すべき追加機能はエージェントモードで、システムがより複雑な作業を分解し、それぞれに適切なモデルを選択できる
Assess
73. Augment Code
- Augment Codeは、大規模コードベースにおいて深いコンテキスト認識を備えた支援を提供するAIコーディングアシスタント
- コードが頻繁に変更される場合でも、高速なコードインデックス更新と高速検索を可能にする高度なcontext engineeringによって際立っている
- AugmentはClaude Sonnet 4および4.5、GPT-5のようなモデルをサポートし、GitHub、Jira、Confluenceと統合され、外部ツールとの相互運用のためのModel Context Protocol (MCP)もサポートする
- リファクタリングや依存関係アップグレードからスキーマ更新まで、複雑なコードベース変更に対する段階的なガイダンスを提供する
74. Azure AI Document Intelligence
- Azure AI Document Intelligence(旧Form Recognizer)は、非構造化文書からテキスト、表、キー・バリューの組を抽出し、構造化データへ変換する
- 事前学習済みのディープラーニングモデルを使ってレイアウトと意味を解釈し、特殊な形式向けにはノーコードのインターフェースを通じてカスタムモデルを訓練できる
- あるチームは、ADIによって手作業のデータ入力が大幅に減り、データ精度が改善し、レポート作成が加速した結果、より迅速なデータドリブンな意思決定につながったと報告している
- Amazon TextractやGoogle Document AIと同様に、強力なレイアウト理解によってエンタープライズ級の文書処理を提供する
75. Docling
- Doclingは、非構造化データの高度な文書処理のためのオープンソースのPythonおよびTypeScriptライブラリ
- PDFやPowerPointのような実際の文書を、クリーンで機械可読な形式に変換する際にしばしば見落とされる「ラストマイル」の問題を解決する
- 従来の抽出ツールと異なり、Doclingはコンピュータビジョンベースのアプローチを用いて文書レイアウトと意味構造を解釈するため、その出力はretrieval-augmented generation (RAG)パイプラインで特に価値が高い
- 複雑な文書をJSONやMarkdownのような構造化形式へ変換し、structured output from LLMsのような技術を支援する
76. E2B
- E2Bは、クラウド上の安全で隔離されたサンドボックスでAI生成コードを実行するためのオープンソースツール
- エージェントは、Firecracker microVM上に構築されたこれらのサンドボックスを使って、安全にコードを実行し、データを分析し、調査を行ったり仮想マシンを運用したりできる
- これにより、実行環境に対する完全な制御とセキュリティを備えたエンタープライズ級AIエージェントを構築・展開できる
77. Helix editor
- コマンドラインのお気に入りであるVimの代替を目指すシンプルなテキストエディタの復活が、やや見られている
- Helixは、Neovimや最近のKakouneと並び、この混み合った分野の競合の1つ
- やや遊び心を込めて自らをポストモダンなテキストエディタと表現しており、Helixは複数カーソル、Tree-sitterサポート、統合されたLanguage Server Protocol(LSP)サポートを特徴としていて、これが最初に私たちの注意を引いた
- 開発中のプラグインシステムを含め活発に開発が進められており、全体としてVimユーザーには親しみやすく感じられる一方で、いくつかの現代的な利便機能を加えた軽量モーダルエディタでもある
78. Kueue
- Kueueは、クォータとリソース消費を管理するジョブキューのためのKubernetesネイティブなコントローラー
- さまざまな優先度とリソース要件を持つKubernetesワークロードを処理するためのAPIを提供し、ジョブをいつ許可または削除するかを決定するジョブレベルのマネージャーとして機能する
- 効率的なリソース管理、ジョブ優先順位付け、高度なスケジューリングのために設計されたKueueは、Kubernetes環境、特にKubeflowのようなツールを使うMLワークロードにおけるワークロード実行の最適化に役立つ
- cluster-autoscalerやkube-schedulerを置き換えるのではなく、それらと連携して動作し、順序、クォータ、優先度、トポロジー認識に基づくジョブ許可に重点を置く
79. MCPScan.ai
- MCPScan.aiは、スキャンとプロキシの2つのモードで動作するModel Context Protocol (MCP)サーバー向けセキュリティスキャナー
- スキャンモードでは、設定とツール説明を分析して、プロンプトインジェクション、ツールポイズニング、toxic flowsのような既知の脆弱性を検出する
- プロキシモードでは、MCPScan.aiはエージェントシステムとMCPサーバーの間のブリッジとして機能し、ランタイムトラフィックを継続的に監視する
- このモードでは、ツール呼び出しの検証、PII検出、データフロー制約を含むカスタムセキュリティルールやガードレールも適用する
80. oRPC
- oRPC(OpenAPI Remote Procedure Call)は、TypeScriptでエンドツーエンドの型安全なAPIを提供しつつ、OpenAPI仕様に完全準拠
- 完全なOpenAPI仕様を自動生成でき、統合とドキュメント化を簡素化可能
- tRPC や ElysiaJS のような代替手段では、型安全性を得るために新しいフレームワークの採用が必要になることが多い一方、oRPCはExpress、Fastify、Hono、Next.js を含む既存のNode.jsフレームワークとシームレスに統合
- この柔軟性により、破壊的なリファクタリングなしで既存APIにエンドツーエンドの型安全性を導入したいチームにとって優れた選択肢
81. Power user for dbt
- Power user for dbt は、dbt と dbt Cloud の両環境に直接統合されるVisual Studio Code向け拡張機能
- dbtは依然として私たちのお気に入りのツールの1つであり、その使いやすさを向上させるものはすべて、エコシステムに歓迎される追加要素
- 以前は開発者がSQLコードをIDEの外で検証したり、モデルのリネージを調べたりするために複数のツールに頼っていた
- この拡張により、それらの機能がVS Codeに組み込まれ、コード補完、リアルタイムのクエリ結果、視覚的なモデルおよびカラムのリネージを提供
82. Serena
- Serena は、Claude Code のようなコーディングエージェントに対し、意味論的なコード検索と編集のためのIDEライクな機能を提供する強力なコーディングツールキット
- シンボルレベルで動作し、コードの関係構造を理解することで、Serenaはトークン効率を大幅に改善
- コーディングエージェントは、ファイル全体を読んだり粗い文字列置換に頼ったりする代わりに、find_symbol、find_referencing_symbols、insert_after_symbol のような精密なSerenaツールを使ってコードを見つけて編集可能
- 小規模なプロジェクトでは影響は小さいが、コードベースが大きくなるほど、この効率性は非常に価値がある
83. SweetPad
- SweetPad 拡張は、AppleプラットフォームでのSwiftアプリケーション開発のライフサイクル全体にわたって、開発者がVS CodeまたはCursorを使えるようにする
- xcodebuild、xcode-build-server、swift-format などの必須ツールを統合し、Xcodeへ継続的に切り替える必要を排除
- 開発者はシミュレータを管理し、デバイスへデプロイしながら、Xcodeを開かずにIDEから直接、iOS、macOS、watchOS向けのSwiftアプリケーションをビルド、実行、デバッグ可能
84. Tape/Z (Tools for Assembly Program Exploration for Z/OS)
- Tape/Z(Tools for Assembly Program Exploration for Z/OS)は、メインフレームのHLASM(High-Level Assembler)コード解析のための進化中のツールキット
- Thoughtworkerによって開発され、パース、制御フローグラフの構築、依存関係の追跡、フローチャートの可視化といった機能を提供
- メインフレーム領域では、オープンでコミュニティ主導のツールが希少であり、ほとんどの選択肢が独自仕様かベンダーのエコシステムに結び付いていることを、私たちは長らく指摘してきた
- Tape/Zは、アクセスしやすくスクリプト可能な解析機能を提供することで、そのギャップを埋める助けとなる
[Languages and Frameworks]
Adopt
85. Fastify
- Fastify については引き続き良好な経験を得ている。Node.js向けの高速で、意見の押し付けがなく、オーバーヘッドの低いWebフレームワーク
- パース、検証、シリアライズを含む最小限のWebフレームワークに必要な機能一式に加え、堅牢なプラグインシステムと強力なコミュニティサポートを提供
- チームは、Express.js のような代替手段と比べてFastifyに大きな欠点を見いだしておらず、測定可能な性能向上も得られているため、Node.jsでのミニマルなWeb開発における魅力的な選択肢
86. LangGraph
- LangGraph は、LLMを使って状態保持型のマルチエージェントアプリケーションを構築するためのオーケストレーションフレームワーク
- ノードやエッジのような低レベルのプリミティブと、エージェントワークフロー、メモリ管理、状態永続化を開発者が細かく制御できる組み込み機能を提供
- これにより、開発者はシンプルな事前構築済みグラフから始めて、複雑で進化するエージェントアーキテクチャへ拡張できる
- ストリーミング、高度なコンテキスト管理、モデルフォールバック、ツールエラー処理といったレジリエンスパターンをサポートしており、LangGraphは堅牢な本番級エージェントアプリケーションを構築可能
87. vLLM
- vLLM は、クラウドまたはオンプレミスで実行できる、LLM向けの高スループットかつメモリ効率の高い推論エンジン
- 複数のモデルアーキテクチャと、人気の高いオープンソースモデルをサポート
- チームは、NVIDIA DGX や Intel HPC などのGPUプラットフォームにdockerized vLLM workerをデプロイし、Llama 3.1(8Bおよび70B)、Mistral 7B、Llama-SQL を含むモデルを、開発者のコーディング支援、知識検索、自然言語によるデータベース対話のためにホスティング
- vLLMはOpenAI SDK標準と互換性があり、一貫したモデルサービングが可能
Trial
88. Crossplane
- Radarに最後に登場して以降、Crossplane の採用は引き続き増加しており、特にKubernetesクラスターの拡張で使われている
- 作業の中で、Crossplaneは汎用インフラコード(IaC)ツールというより、特定のユースケースで優れていることが分かった
- 以前の観察は今も有効で、CrossplaneはKubernetes内にデプロイされたワークロードの伴走役として最もよく機能し、Terraformのようなツールの完全な代替ではない
- Crossplaneを主要なIaCソリューションとして「全面採用」したチームはしばしば苦戦したが、実用的に使ったチーム、つまり対象を絞ったカスタムユースケースのために使ったチームは、強力な成果を得た
89. DeepEval
- DeepEval は、LLM性能評価のためのオープンソースのPythonベース評価フレームワーク
- LlamaIndex または LangChain で構築された retrieval-augmented generation (RAG) やその他のアプリケーションの評価、ならびにモデルのベースラインおよびベンチマークに利用可能
- DeepEvalは、単語一致スコアを超えて、実際のシナリオでより信頼できる評価を提供するために、正確性、関連性、一貫性を評価
- 幻覚検出、回答関連性、ハイパーパラメータ最適化などのメトリクスを含み、ユースケース別のカスタムメトリクス作成のための GEval もサポート
90. FastMCP
- Model Context Protocol (MCP) は、LLMアプリケーションにコンテキストとツールを提供する標準として急速に定着しつつある
- しかし、MCPサーバーの実装には通常、設定、プロトコル処理、エラー管理のためのかなりのボイラープレートが含まれる
- FastMCP は、プロトコルの複雑さを抽象化し、開発者が直感的なPythonデコレータを通じてMCPリソースとツールを定義できるようにすることで、このプロセスを簡素化するPythonフレームワーク
- この抽象化により、チームはビジネスロジックに集中でき、よりクリーンで保守しやすいMCP実装につながる
91. LiteLLM
- LiteLLM は、標準化されたOpenAI API形式を通じて複数のLLMプロバイダーとのシームレスな統合を提供するSDK
- 幅広いプロバイダーとモデルをサポートし、テキスト補完、埋め込み、画像生成のための統一インターフェースを提供
- プロバイダーごとのAPIの違いを抽象化することで、LiteLLMは統合を簡素化し、リクエストを自動的に正しいモデルエンドポイントへルーティングする
- プロキシフレームワークを通じて、ガードレール、キャッシュ、ロギング、レート制限、ロードバランシングといった本番運用向け機能も備えている
92. MLForecast
- MLForecast は、大規模データセットに機械学習モデルを適用する時系列予測のためのPythonフレームワークおよびライブラリ
- ラグ、ローリング統計、日付ベースの特徴量を含む、一般に複雑な自動特徴量エンジニアリングのプロセスを簡素化する
- SparkやDaskのような分散コンピューティングフレームワークをネイティブにサポートする数少ないライブラリの1つであり、スケーラビリティを確保
- conformal prediction のような手法を用いた確率的予測もサポートし、予測の不確実性を定量的に測定できる
93. Nuxt
- Nuxt は、フルスタックWebアプリケーションの作成のために Vue.js 上に構築された、意見を持ったメタフレームワークであり、しばしば「Vue.js向けのNext.js」として知られている
- Reactの対応物と同様に、Nuxtは事前レンダリング、サーバーサイドレンダリング(SSR)、メタデータ管理といったSEOフレンドリーな機能を提供する
- NuxtはNext.jsの背後にいるのと同じ企業であるVercelの支援を受けており、強力なコミュニティと公式・サードパーティーモジュールのエコシステムにも支えられている
- これらのモジュールは、画像処理、サイトマップ、Tailwind CSS のような機能の統合を簡素化する
94. Phoenix
- Phoenix に対する好意的な評価を引き続き持っている。これは Elixir で書かれたサーバーサイドのWeb MVCフレームワーク
- Phoenixは、Ruby on Railsの迅速なアプリケーション開発と開発者体験から学びつつ、関数型プログラミングのパラダイムへと発展している
- このボリュームでは、Phoenix LiveView 1.0 のリリースを強調している
- LiveViewは、HTMX や Hotwire に似たHTML-over-the-wireソリューションで、開発者は完全にサーバーレンダリングされたHTMLでリッチかつリアルタイムなユーザー体験を構築できる
95. Presidio
- Presidio は、構造化テキストおよび非構造化テキストから機密データを identifying し、anonymizing するためのデータ保護SDK
- named entity recognition、正規表現、ルールベースロジックを使用して、クレジットカード番号、氏名、所在地のような個人識別情報(PII)を検出する
- Presidioは custom エンティティ認識器と匿名化パイプラインをサポートしており、組織は自社のプライバシーおよびコンプライアンス要件に合わせて調整できる
- チームは、LLMと統合する際に、厳格なデータ共有制御が求められるエンタープライズ環境でPresidioを使用している
96. Pydantic AI
- Pydantic AI は、本番環境でGenAIエージェントを構築するための、安定していて十分にサポートされたオープンソースフレームワークであることを引き続き証明している
- 信頼できる Pydantic 基盤の上に構築されており、強力な型安全性、OpenTelemetryによる第一級の可観測性、組み込みの評価ツールを提供する
- 2025年9月4日のバージョン1.0リリースは、成熟度における重要なマイルストーンを示している
- それ以降、そのシンプルさと保守性により信頼され広く採用され、LangChainや LangGraph のような他の人気エージェントフレームワークの列に加わっている
97. Tauri
- Tauri は、単一のWeb UIコードベースを使って高性能なデスクトップアプリケーションを構築するためのフレームワーク
- Electronのような従来のWebラッパーとは異なり、Tauriは Rust を基盤として構築され、OSのネイティブwebviewを活用することで、より小さなバイナリとより強固なセキュリティを提供する
- 数年前にTauriを初めて評価しており、その後はデスクトップを超えてiOSおよびAndroidのサポートへと拡張された
- 最新バージョンは、より柔軟な権限およびスコープモデルを導入し、従来の権限リストを置き換えるとともに、生データ転送をサポートし、性能を改善する強化されたプロセス間通信(IPC)レイヤーを特徴としている
Assess
98. Agent Development Kit (ADK)
- Agent Development Kit (ADK) は、単にプロンプトに依存するのではなく、現代的なソフトウェアエンジニアリングの規律を適用するAIエージェントの開発・デプロイ用フレームワーク
- クラス、メソッド、ワークフローパターン、CLIサポートといった馴染みのある抽象化を導入
- LangGraphやCrewAIのようなフレームワークと比べて、ADKの強みはGoogleのAIインフラとの深い統合にあり、エンタープライズ対応のグラウンディング、データアクセス、モニタリングを提供する
- 相互運用性を考慮して設計されており、ツールラッパーおよびエージェント間通信のための A2A protocol をサポート
99. Agno
- Agno は、マルチエージェントシステムを構築、実行、管理するためのフレームワーク
- 完全自律型エージェントまたは制御された段階的ワークフローを生成できる柔軟性を提供し、human-in-the-loop、セッション管理、メモリ、ナレッジのための組み込みサポートを含む
- 優れたエージェント起動時間と低いメモリ消費から、その効率性への注力を高く評価している
- Agnoには独自ランタイムである AgentOS が付属しており、これはエージェントシステムの簡素化されたテスト、モニタリング、管理のための統合コントロールプレーンを備えたFastAPIアプリケーション
100. assistant-ui
- assistant-ui は、AIチャットインターフェース向けのオープンソースTypeScriptおよびReactライブラリ
- メッセージ編集や分岐切り替えのためのストリーミング、状態管理、一般的なUX機能といったチャットUI実装の複雑な部分を処理しつつ、開発者がRadixプリミティブを使って独自のコンポーネントを設計できる
- Vercel AI SDK や LangGraph を含む人気ランタイムとの統合をサポートし、複雑なユースケース向けにカスタマイズ可能なランタイムソリューションを提供
- assistant-uiでシンプルなチャットインターフェースを問題なく構築でき、その結果にも満足している
101. AutoRound
- IntelのAutoRoundは、LLMやvision language models(VLM)などの大規模AIモデルを、精度低下を最小限に抑えながら圧縮するための高度な量子化アルゴリズム
- sign-gradient descent最適化を使用してモデルサイズを超低ビット幅(2〜4ビット)に削減し、最適な効率のためにレイヤー全体に混合ビット幅を適用
- この量子化プロセスは非常に高速でもあり、単一GPUで数分のうちに70億パラメータのモデルを量子化可能
- AutoRoundは、vLLMやTransformersのような人気の推論エンジンと統合されており、モデル量子化の有力な選択肢
102. Browser Use
- Browser Useは、LLMベースのエージェントがWebブラウザーを操作し、Webアプリケーションと対話できるようにするオープンソースのPythonライブラリ
- ナビゲーション、データ入力、テキスト抽出を行え、アプリケーション間で作業を調整するために複数タブの管理も可能
- このライブラリは、AIエージェントがWebコンテンツから情報にアクセス、操作、検索する必要がある場合に特に有用
- さまざまなLLMをサポートし、Playwrightを活用して、より豊かなWebインタラクションのために視覚的理解とHTML構造の抽出を組み合わせる
103. DeepSpeed
- DeepSpeedは、学習と推論の両方に向けて分散ディープラーニングを最適化するPythonライブラリ
- 学習向けには、Zero Redundancy Optimizer (ZeRO)や3D並列処理のような技術を統合し、数千台のGPU上でモデルを効率的にスケール
- 推論向けには、テンソル、パイプライン、エキスパート、ZeRO並列処理をカスタムカーネルおよび通信最適化と組み合わせて、レイテンシを最小化
- DeepSpeedは、Megatron-Turing NLG(530B)やBLOOM(176B)を含む、世界最大級の言語モデルのいくつかを支えている
104. Drizzle
- Drizzleは軽量なTypeScript ORM
- Prisma ORMとは異なり、開発者にシンプルなSQL風APIと、より伝統的なORMスタイルのクエリインターフェースの両方を提供
- 既存データベースからのスキーマ抽出もサポートしており、データベースファーストとコードファーストの両方のアプローチが可能
- Drizzleはサーバーレス環境を念頭に設計されており、小さなバンドルサイズとprepared statementsのサポートを備える
105. Java post-quantum cryptography
- 量子コンピューターは引き続き急速に進化しており、AWS BraketのようなSaaS提供によって、いまや複数のアーキテクチャー上で量子アルゴリズムへのアクセスが可能になっている
- 3月以降、Java 24はJava post-quantum cryptographyを導入し、ML-KEMやML-DSAのような耐量子暗号アルゴリズムのサポートを追加
- .Net 10でもサポートを拡大
- 助言はシンプルで、これらの言語でソフトウェアを構築しているなら、システムを将来にわたって耐えうるものにするため、今から耐量子アルゴリズムの採用を始めるべき
106. kagent
- Kagentは、Kubernetesクラスター内でエージェントAIを実行するためのオープンソースフレームワーク
- LLMベースのエージェントが、KubernetesネイティブAPIおよびModel Context Protocol (MCP)統合を通じて、問題診断、設定修正、可観測性ツールとの対話といった運用タスクを計画・実行できるようにする
- 目標は、宣言的管理と自律的推論を組み合わせて「AgentOps」をクラウドネイティブインフラにもたらすこと
- CNCF Sandboxプロジェクトとして、Kagentは特にLLMに運用管理機能を与えるリスクを考えると慎重に導入すべきであり、toxic flow analysisのような技法は、こうしたリスクを評価・緩和する際に特に価値がある可能性がある
107. LangExtract
- LangExtractは、LLMを使って、ユーザー定義の指示に従い非構造化テキストから構造化情報を抽出するPythonライブラリ
- 臨床ノートやレポートのようなドメイン固有の資料を処理し、抽出された各データポイントをソースに追跡可能な状態に保ちながら、重要な詳細を特定して整理
- 抽出されたエンティティは
.jsonlファイル(言語モデルデータの標準形式)としてエクスポートでき、文脈確認のための対話型HTMLインターフェースで可視化可能 - チームは、ドメイン知識グラフを埋めるためにエンティティを抽出するLangExtractを評価し、複雑な文書を構造化され機械可読な表現へ変換するうえで効果的だと判断した
108. Langflow
- Langflowは、LLMワークフローを構築・可視化するためのオープンソースのローコードプラットフォーム
- LangChain上に構築されており、開発者はドラッグ&ドロップのインターフェースを通じて、プロンプト、ツール、ベクターデータベース、メモリーコンポーネントをチェーン接続でき、さらに高度なロジック向けのカスタムPythonコードもサポート
- 完全なバックエンドコードを書かずにエージェントアプリケーションをプロトタイピングするのに特に有用
- ただし、Langflowは依然として比較的新しく、本番利用に向けていくつか荒削りな部分があり、ローコードプラットフォームに対する一般的な注意点はここでも当てはまる
109. LMCache
- LMCacheは、LLMサービングインフラを高速化するキー・バリュー(KV)キャッシュソリューション
- LLM推論エンジンプール全体にまたがる専用キャッシュレイヤーとして機能し、チャット履歴や文書コレクションのように複数回処理される可能性があるテキストに対する事前計算済みKVキャッシュ項目を保存
- これらの値をディスクに保持することで、prefill計算をGPUからオフロードし、time-to-first-token(TTFT)を短縮するとともに、RAGパイプライン、複数ターンのチャットアプリケーション、エージェントシステムのような負荷の高いワークロード全体で推論コストを削減
- vLLMやNVIDIA Dynamoのような主要な推論サーバーとLMCacheを統合でき、構成への影響を評価する価値がある
110. Mem0
- Mem0は、AIエージェント向けに設計されたメモリーレイヤー
- 素朴なアプローチでは、しばしばチャット履歴全体をデータベースに保存して将来の会話で再利用するため、過剰なトークン使用につながる
- Mem0はこれを、短期的な想起と、重要な事実および関係だけを抽出・保存するインテリジェントな長期レイヤーにメモリーを分離する、より洗練されたアーキテクチャーへ置き換える
- このアーキテクチャーは、意味的類似性のためのベクターストアと、時間的・関係的データを理解するための知識グラフを組み合わせる
111. Open Security Control Assessment Language (OSCAL)
- Open Security Controls Assessment Language (OSCAL) は、コンプライアンス対応とリスク管理における自動化を高め、チームがテキストベースの手作業のアプローチから脱却できるよう支援するために設計された、オープンで機械可読な情報交換フォーマット
- 米国国立標準技術研究所(NIST)が主導しており、OSCAL は SOC 2 や PCI のような業界フレームワーク、および米国の FedRAMP、シンガポールの Cybersecurity Control Catalogue、オーストラリアの Information Security Manual のような政府フレームワークに関連するセキュリティコントロールを表現するための standard representations in XML, JSON and YAML を提供
- OSCAL はまだ公共部門以外では広く採用されておらず、エコシステムもなお成熟途上にあるものの、セキュリティ評価を簡素化し、スプレッドシートやチェックボックス中心の作業への依存を減らし、compliance-as-code や continuous compliance プラットフォームに統合された際に自動化されたコンプライアンスを可能にする潜在力に期待
112. OpenInference
- OpenInference は、AI アプリケーションを観測するために設計された規約とプラグインのセットで、OpenTelemetry を補完
- 機械学習フレームワークおよびライブラリに対する標準化された計測を提供し、開発者がベクトルストア検索や API・検索エンジンへの外部ツール呼び出しのような周辺コンテキストとともに LLM 呼び出しを追跡できるよう支援
- スパンはすべての OTEL 互換コレクターにエクスポートできるため、既存のテレメトリパイプラインとの整合性を確保
- 以前に一般的に使われていた LLM 可視化プラットフォームである Langfuse を blip しており、OpenInference SDK は Langfuse やその他の OpenTelemetry 互換可視化プラットフォームにトレースを記録可能
113. Valibot
- Valibot は TypeScript のスキーマ検証ライブラリ
- Zod や Ajv のような他の人気 TypeScript 検証ライブラリと同様に型推論を提供するが、モジュール式の設計が差別化要因
- このアーキテクチャにより、バンドラーが効果的なツリーシェイキングとコード分割を行い、実際に使用される検証関数だけを含められる
- Valibot は最適なシナリオでは Zod と比べてバンドルサイズを最大 95% まで削減できるため、クライアントサイド検証やサーバーレス関数のようにバンドルサイズが重要な環境におけるスキーマ検証の有力な選択肢
114. Vercel AI SDK
- Vercel AI SDK は、TypeScript エコシステムで AI ベースのアプリケーションやエージェントを構築するためのオープンソースのフルスタックツールキット
- 2 つの主要コンポーネントで構成される: AI SDK Core は、テキスト生成、構造化オブジェクト生成、ツール呼び出しをサポートし、モデル非依存で LLM 呼び出しを標準化
- AI SDK UI は assistant-ui と同様に、React、Vue、Next.js、Svelte においてストリーミング、状態管理、リアルタイム UI 更新によってフロントエンド開発を簡素化
- すでに TypeScript および Next.js エコシステム内で作業しているチームにとって、Vercel AI SDK は豊かなクライアントサイド体験を備えた AI アプリケーションを構築するための迅速でシームレスな方法を提供
まだコメントはありません。