clopus-watcher - Claude Code型の自律型24/7オンコールエンジニア
(github.com/kubeden)- Kubernetes環境の障害対応自動化を目的としたAIベースの監視ツール
- Claude Codeを活用してPodの状態をリアルタイム分析し、エラーを検知して自動修正またはレポート生成を実行
- CronJob形式で定期実行され、運用担当者が不在の時間帯でも24時間の自律対応体制を維持
- 主な動作
- 対象NamespaceのPod状態を監視
- CrashLoopBackOff、Errorなどの異常状態を検知
- ログ分析を通じてエラー原因を特定
- 必要に応じてPod内部に入りホットフィックスを適用
- 修正履歴をSQLite DBに記録し、レポートを提供
- 別途Dashboardデプロイ構成を通じて、Web UIでエラーおよび修正履歴の可視化をサポート
- Go + HTML + Shellで構成された軽量アーキテクチャで、Kubernetes CronJobデプロイに最適化
- MITライセンス
1件のコメント
似たようなものがあるといいなと思っていたのですが、よさそうですね。watcher modeで使えば、安全にまずテストから試せそうです。