Slackのデプロイプロセス

(slack.engineering)

12 ポイント投稿者 xguru 2020-04-06 | 1件のコメント | WhatsAppで共有

リスク管理のためにデプロイ担当者を訓練し、すべての段階を監督し、コミュニケーションを担当させる。

問題を可能な限り早く検知し、原因となったPRを特定して取り除いたうえで新しいビルドをデプロイする。

本番環境までの間に発見できなかった問題が発生した場合は、調査の前にまずロールバックを行う。

会社の初期にEC2インスタンスを10台だけ運用していた頃のデプロイは、単に rsync するだけだった。

本番デプロイ前にはStagingの1段階しか存在せず、テスト後にそのままデプロイを進めていた。

顧客が増えるにつれて、rsync だけでは難しくなった。

→ Full parallel pull-basedシステムへ変更

新しいビルドをサーバーにスクリプトで投入するのではなく、各サーバーがConsulキーの変更によるシグナルを受けたときに同時にビルドを取得するようにした。

→ Hot/Coldフォルダに分離したAtomic Deploy

デプロイ時には新しいコードを使用していないColdディレクトリにコピーし、既存サービスはHotディレクトリが配信する。

サーバーにアクティブなプロセスがないときにHot/Coldディレクトリを相互に切り替え、新しいコードを即座に配信する。

1件のコメント

xguru 2020-04-06

SlackのバックエンドはHHVM上で動くPHP/Hacklangなので、あのHot/Coldの切り替えが可能なようです。