私のチームでは週2回、当番制でサービスのログをチェックして問題がないか確認しています こんな感じで当番の人に通知して当番をまわしています サービスのエラーログはelasticsearchとkibanaで可視化しているので、確認自体はさほど大変ではないのですが、問題が起きていない場合がほとんどで作業コストの方が大きく感じてしまいます... そのせいか、最近はみんなの妹への反応が薄いような気もします... #エラーログの確認を自動化して異常があれば通知する そんな話をしていたら誰かに「elastalert」というツールを教えてもらいました elastalertは、Elasticsearchのインデックスをモニタリングして設定した条件とマッチした時にalertを通知するためのツールのようです 本家ドキュメント: https://elastalert.readthedocs.org/en/late