«Мир изменился… Я чувствую это в воде… Я чувствую это в земле…»
Галадриэль
«Какой-то отсталый у неё мониторинг»
Сева Поляков
В этом докладе я хочу рассказать вам историю о современном мониторинге, на примере выбора для моего текущего проекта. Когда нужен prometheus, когда нужен SaaS и почему графит не умрёт. Также я постараюсь пройтись по всем новинкам и важным изменениям в современном мире мониторинга.
13. Стоимость в год:
(1300 * 12) = 15.600$
• Стоимость серверов: 3 (m4.x2large + 1 Tb) ≈ 1300$/m
14. Стоимость в год:
(1300 * 12) + (4500 * 12) = 69.600$
• Стоимость серверов: 3 (m4.x2large + 1 Tb) ≈ 1300$/m
• Стоимость 30% времени команды: (15.000$/m * 30)/100 ≈
4500$
15. Стоимость в год:
(1300 * 12) + (4500 * 12) = 69.600$
• Стоимость серверов: 3 (m4.x2large + 1 Tb) ≈ 1300$/m
• Стоимость 30% времени команды: (15.000$/m * 30)/100 ≈
4500$
• Упущенная выгода на внедрение = месяц * все деньги от
даунтаймов ≈ бесценно.
23. • Есть ли люди которым интересно заниматься и
поддерживать мониторинг?
• Какие фичи нам нужны и в каких решениях они есть?
• Сколько метрик мы собираемся собирать?
• Сколько времени мы хотим хранить данные?
26. Чеки на хостах
Плюсы:
• Не нужна база данных
• Простая логика
Минусы:
• Всё равно нужна база данных
• Простой логики недостаточно
• Нет предсказаний
• Нет истории
27. Что хранить в БД?
• События:
• Можно делать что-угодно
28. Какие бывают события
• Статус ответа
• Время выполнения чего-то
• Ошибки
• Уникальные ID
• Потребление какого-то ресурса
32. Типичная математика
• Количество за фрейм времени (чтобы видеть тренд)
• Гистограммы (распределения)
• Среднеемаксимальноеминимальное
• Перцентили
33. Что хранить в БД?
• События:
• Дорого опрашивать
• Дорого хранить
54. Prometheus
• Удобно устанавливать
• Алертинг из коробки
• Cross-region из коробки
• Поддерживает теги
• Медленный и ресурсоемкий (не тестировал новую версию)
• Слабая математика
• Проблемы с перцентилями
• Проблема с историческими данными (нет инструментов для
ребалансинга)
64. Graphite
• Нет алертинга
• В меру проворный
• Достаточно математики
• Нет тегов (есть наработки)
• Своеобразный ребалансинг кластера
• И вообще кластер своеобразный
74. Функции
• Всё что в графите
• diffSeriesLists
• multiplySeriesLists
• Fast Fourier transform
• Kolmogorov–Smirnov test
• Low-pass filter
• Pearson correlation coefficient
• Polynomial regression
• Tukey's range test
75. Go-graphite
• Нет алертинга
• Быстрый на чтение
• Вменяемая расширяемость кластера (buckytools)
• Есть теги… ну можно прикрутить
• И с математикой всё отлично
• Читает из всех источников