2022年1月の100%割引イベント障害のポストモーテム
(tech.inflab.com)インフランサービスで発生した、2022年1月3日から17日まで継続的にサービスを利用できなかった障害のポストモーテム記事です。障害の発見、初動対応、再発、根本原因の分析、根本原因の解決までの過程を詳しく扱っています。
インフランサービスで発生した、2022年1月3日から17日まで継続的にサービスを利用できなかった障害のポストモーテム記事です。障害の発見、初動対応、再発、根本原因の分析、根本原因の解決までの過程を詳しく扱っています。
5件のコメント
良い文章をありがとうございます。ところで、「回顧」という良い言葉があるのに、なぜ「解剖」という言葉を使われたのでしょうか? 間違った言い方ではありませんが、少し否定的に感じられますね。
Postmortem の訳語として、インシデント発生後に行った対応を報告する際に「検死」という言葉をよく使うようですね。
私はサービスが死んだので(…)解剖する、というニュアンスだと思って面白く感じたのですが。別の受け取り方をすることもあるのでしょうね。『m 』
おそらくNetflixのポストモーテムメール(postmortem email)のようなニュアンスだと思います。
特に、PostgreSQL の Dead Tuple がサービスに及ぼしうる影響を実感できる根本原因分析の部分は、良い参考になると思います。