The Delivery Hero Reliability Manifesto(翻訳)
(moonsub-kim.github.io)内容の一つひとつがとても印象深く、簡単には要約できないので、最も心に響いたものをいくつかだけ挙げます。
- Manifestoに違反しない。ルールを変更するための議論を行い、Manifestoを発展させる。
- すべてのサービスは依存関係を含めてアーキテクチャ図として文書化し、アーキテクチャはレビューを受けなければならない。
- データの生産者は、自らが生産するデータも文書化しなければならない。
- 金曜日のデプロイでも安定して動作しなければならない。
- 障害状況に対する防御ロジック(タイムアウト、リトライ、サーキットブレーカー、フォールバック、スロットリング、冪等性など)を実装する。
- サービスの状態を把握できるダッシュボード(1分あたりのリクエスト数、エラー率、サーバー応答時間、ビジネスメトリクス)を作成して監視する。
- イシューを分析し再現する方法をランブックとして作成し、アラートと連携して復旧時間を最小化する。
- 問題が発生したら腕まくりをして、問題解決を助ける。
- テキストで行うすべての会話は、常に善意を持って伝えようとしているのだと考えて受け取ろう。
- セキュリティに関連するアクションをチームの成果として反映するため、チーム別のセキュリティスコア表を作成して公開する。
- システムでは注文数が増えるほど、注文あたりのコストは減少しなければならない。四半期ごとに注文あたりのコストが10%ずつ下がるのが望ましい。
- リードタイム(開発開始から本番デプロイまでの時間)、デプロイ頻度、復旧時間、復旧時間中のエラー率を監視する。
このほかにも内容はまだたくさんありますが、読んでいると、これほどのものを作り上げるまでにいったいどれほど多くの人が貢献したのだろうかと気になりもして……本当に畏敬の念を抱かせる文章です。
まだコメントはありません。