- オブザーバビリティ: システムの外部出力の結果から、システム内部の状態をどれだけうまく推論できるかを示す指標
- メトリクス、イベント、ログ、トレースを収集して可視化・分析
- 内部動作の背景情報を豊富に提供し、より深いシステム障害対応を可能にする
- Grafana Labs、Splunk、Dynatrace、Chronosphere などのオブザーバビリティ企業や、Dimensional Research などの市場調査機関が示した2024年のオブザーバビリティトレンドのうち、3回以上言及されたものを5つに整理
- オブザーバビリティの「ツール」としてのAIの影響力拡大
- AIはシグナル相関、異常検知、根本原因分析、性能最適化の業務に使われ、「システムで何が起きているか」を素早く理解する助けとなる
- AIが異常を検知すると、調査と自動対応を経て問題を自動解決
- 日常プロセスを自動化して長時間作業を減らすツールへの需要は、オブザーバビリティにおけるAI活用を高める
- クラウドネイティブの提供速度に追随するには、組織がマルチクラウドインフラとアジャイル開発プラクティスを大規模に自動化した、正確で予測可能なAIベース分析を必要とする
- 因果・予測・生成AIを組み合わせたオブザーバビリティツールを活用すれば、オブザーバビリティ、セキュリティ、ビジネスデータから豊富な洞察を得て、システムを深く分析できる
- もちろん、「顧客が望むレベルまでAIが信頼性を達成した」と見なせるようになるには時間がかかる
- オブザーバビリティの「対象」としてのAI観測の重要性増大
- 生成AIは、自動化と生産性の武器として、膨大で複雑なデータを爆発的な速度で生成する
- ユーザーはAIでコンテンツを作成し、「自分だけのAI」も直接開発するため、そこから発生・処理されるデータが多い
- AIは医療、法務、金融、旅行など社会の各分野に広範な影響を及ぼすため、十分に理解する必要がある
- AIが正常に動作しているか、あるいはバイアスがあるかなどは重要な観測対象
- 組織はAIを正確かつ具体的に観測する準備ができていなければならない
- AIからメトリクス、ログ、トレースを取得する方法を知っておく必要がある
- オブザーバビリティのコスト削減への取り組み
- 多くの企業が予算の問題に悩み、技術面・事業面の両方からコスト管理の方法を模索し、ITコスト全般を管理している
- 企業がマルチクラウドやクラウドネイティブ環境へ移行するにつれて生成データ量が増え、関連コストも上昇している
- ESGリサーチ: 「組織の69%が、オブザーバビリティデータの増加により、時間の経過とともにデータ収集・保存コストが大きくなることを懸念している」
- Dynatrace: 「チームはリアルタイム分析のために保持するログ、破棄するログ、アクセス性の低い低コストストレージに保管するログを頻繁に判断しなければならない」
- オブザーバビリティのコスト削減策:
- データ増加を抑え、組織が収集したデータからより高い価値を得られるよう支援するツールを使う
- オブザーバビリティの結果に価値を与えない、重複した無関係なイベントをフィルタリングする
- 空値の除去、不要なラベルの削除、非効率なデータフォーマットを「観測対象に適したフォーマット」へ変換、イベントのトリミングや変換
- オープンソースと OpenTelemetry 需要の上昇
- 多くの企業がベンダーロックインへの懸念を解消するため、オープンソース技術に投資し、それをオブザーバビリティ技術スタックの一部として統合している
- Dimensional Research の調査によると、オブザーバビリティ担当の回答者の87%が「OpenTelemetry は今後5年以内にオブザーバビリティデータの標準になる」と答えた
- OpenTelemetry はトレース、メトリクス、ログなどのデータを生成・管理するよう設計されており、特定ベンダーへの依存がない
- これは OpenTelemetry をサポートするあらゆるオブザーバビリティツールと併用できることを意味する
- ただし、OpenTelemetry の導入はまだ初期段階
- OpenTelemetry 導入時には、技術サポートへの懸念、市場導入が広がるまで待つ必要性、経営陣の価値理解不足などの問題がある
- オブザーバビリティツール統合の動き強化
- 複数のオブザーバビリティツールを使う代わりに、ベンダー1〜2社のツールへ統合する動きが強まっている
- Dimensional Research の調査結果では、企業は平均7種類以上のオブザーバビリティ/モニタリングツールを使用している
- オブザーバビリティツールを統合する理由: より迅速な問題確認、コスト削減、チーム協業の改善、ダウンタイム最小化、セキュリティ強化、運用の複雑さ簡素化、教育の必要性低減、データサイロ防止への需要
- Chronosphere: 「開発者や技術チームは、答えを見つけるためにさまざまなユーザーインターフェースやソフトウェアを行き来して時間を使ったり、複数のソフトウェアに費用をかけたりしたくない」
- Dimensional Research: 「ツールが多すぎるとデータ相関を示す際の難しさが増し、環境全体の可視性を制限する『ツールサイロ現象』を招く」
- オブザーバビリティツールをベンダー1〜2社のツールに統合すれば、断片化されたデータを集約し、データ収集・消費方式を標準化しやすい
まだコメントはありません。