Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
SlideShare a Scribd company logo
Велосипед уже
изобретен. Что умеют
промышленные СХД?
Антон Жбанков, Nutanix
Мифы о СХД
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
Распространенные мифы
• Корпоративные СХД – это очень дорого. Но при этом они не
говорят сколько стоит.
• Вендоры СХД берут деньги ни за что.
• Я на коленке соберу не хуже из «писюков».
• СХД – это просто куча дисков.
• СХД надо сравнивать по руб/ТБ емкости.
Производительность – это МБ/с
Ikea Style – не всегда ОК
02.11.11 Недоступность
сервиса
По версии Селектел – сбой ПО
3.03.12 Недоступность
сервиса,
даунтайм
Проблемы с программной СХД – баг в mdraid
28.03.12 Недоступность
сервиса,
даунтайм
Проблемы с программной СХД – баг в mdraid
04.06.12 Недоступность
сервиса
Проблемы с программной СХД
17.08.12 Недоступность
сервиса,
даунтайм
Цитата: “Один доблестный сотрудник (с которым будет очень
серьёзный разговор) так скоммутировал SAN, что мы два часа
разгребали последствия в сетях.”
24.09.12 Недоступность
сервиса,
даунтайм
Неполадки с ядром сети на основе коммутаторов Juniper,
повреждение оптического кабеля
Ikea Style – не всегда ОК
• 22 000 пользователей
• 2 дня простоя
• Полная потеря данных
Общая проблематика
Самая медленная часть СХД
• Производительность измеряется в IOPS
• А совсем не в МБ/с
• Ограничено законами физики
• Seek latency
• Rotational latency
• 15 000 об/м – предел
• Скорость звука
• Не менялось с 2000 года
RAID
RAID
• Redundant Array of Inexpensive Disks
• Избыточный массив недорогих дисков
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
Проклятие RAID
• Каждая операция записи
превращается в несколько
• RAID Penalty
• RAID 0 = 1
• RAID 1 = 2
• RAID 5 = 4
• RAID 6 = 6
RAID 0 RAID 1 RAID 5 RAID 6
Производительность
Что же отличает СХД от полки с дисками?
• СХД не хочет обращаться к диску
• Кэш в оперативной памяти контроллера
• Flash-кэш второго уровня
• Предиктивное чтение
• СХД избегает случайной записи
• Писать полными страйпами
• RAID Penalty = (N+1) / N, где N – число дисков
Не все данные одинаково полезны
Flash cache
• Кэш второго уровня
• Энергонезависим
• В сотни раз больше оперативного
• В десятки раз быстрее магнитных дисков
• Две реализации логики
• Read-only
• Read/Write
• Две аппаратных реализации
• Специализированная PCI карта
• Стандартный диск SSD (EFD)
Контроль и управляемость
• Мониторинг
• Мощный встроенный мониторинг
• Интеграция с корпоративными системами мониторинга
Контроль и управляемость
• Мониторинг
• Мощный встроенный мониторинг
• Интеграция с корпоративными системами мониторинга
• Quality of Service (QoS)
• Спасение от «шумного соседа»
• Гарантия производительности
• Ограничение по производительности
Экономия
Многоуровневое хранение (tiering)
• В большинстве случаев – оптимизация по стоимости
• Холодные данные на дешевые, но емкие носители
• Перемещение данных 1 раз в сутки
• Большой размер блока (256 МБ)
• Улучшение производительности
• Для систем с большим запасом вычислительной мощности
• Hi End
• Гиперконвергентные системы и SDS
Многоуровневое хранение (tiering)
• Будьте внимательны
• Реализация тиринга иногда специфична
• Знайте свой профиль нагрузки
• Тиринг вам может не помочь от слова СОВСЕМ
• Маркетинг работает
Защита данных
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
Снимки (snapshots)
• Защита от логических сбоев
• Развалилась БД
• Удалили файл
• Использование в качестве тестовой площадки
• Тесты на реальных данных
• Резервное копирование
• Бэкап снимка, а не самих данных
• Поддержка почти всеми СРК корпоративного класса
Журналирование
• Журнал
• Отдельное хранилище данных
• Циклично записывает все операции записи
• Спасает от логических сбоев с высочайшей гранулярностью
• Вплоть до единичной дисковой операции
• Интегрируется с прикладным софтом (на конкретный commit)
Катастрофоустойчивость
Репликация данных
• Создание удаленной копии данных
• Всегда схема Active-Passive
• Cинхронная
• <100 км
• Идентичная копия
• Асинхронная
• Любые расстояния
• Близко к идентичной
Метрокластер
• СХД в активном зеркале
• Active-Active
• Синхронная
• <100 км
• Приложение не знает где работает
• Полная автоматика
Выводы
Что же делать?
• Узнай свои данные и нагрузку
• Сколько стоит простой бизнеса
• Сколько стоит потеря данных
• Насколько схема «сделай сам» в политике компании?
• Справится ли компания с разработкой?
• А с поддержкой?
• А если вот ты персонально уйдешь из компании?
Антон Жбанков • 8x VMware vExpert
• VCP, MCITP
• EMC Cloud Architect Expert
• http://blog.vadmin.ru
• anton.zhbankov@nutanix.com

More Related Content

Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)

  • 1. Велосипед уже изобретен. Что умеют промышленные СХД? Антон Жбанков, Nutanix
  • 4. Распространенные мифы • Корпоративные СХД – это очень дорого. Но при этом они не говорят сколько стоит. • Вендоры СХД берут деньги ни за что. • Я на коленке соберу не хуже из «писюков». • СХД – это просто куча дисков. • СХД надо сравнивать по руб/ТБ емкости.
  • 6. Ikea Style – не всегда ОК 02.11.11 Недоступность сервиса По версии Селектел – сбой ПО 3.03.12 Недоступность сервиса, даунтайм Проблемы с программной СХД – баг в mdraid 28.03.12 Недоступность сервиса, даунтайм Проблемы с программной СХД – баг в mdraid 04.06.12 Недоступность сервиса Проблемы с программной СХД 17.08.12 Недоступность сервиса, даунтайм Цитата: “Один доблестный сотрудник (с которым будет очень серьёзный разговор) так скоммутировал SAN, что мы два часа разгребали последствия в сетях.” 24.09.12 Недоступность сервиса, даунтайм Неполадки с ядром сети на основе коммутаторов Juniper, повреждение оптического кабеля
  • 7. Ikea Style – не всегда ОК • 22 000 пользователей • 2 дня простоя • Полная потеря данных
  • 9. Самая медленная часть СХД • Производительность измеряется в IOPS • А совсем не в МБ/с • Ограничено законами физики • Seek latency • Rotational latency • 15 000 об/м – предел • Скорость звука • Не менялось с 2000 года
  • 10. RAID
  • 11. RAID • Redundant Array of Inexpensive Disks • Избыточный массив недорогих дисков
  • 13. Проклятие RAID • Каждая операция записи превращается в несколько • RAID Penalty • RAID 0 = 1 • RAID 1 = 2 • RAID 5 = 4 • RAID 6 = 6 RAID 0 RAID 1 RAID 5 RAID 6
  • 15. Что же отличает СХД от полки с дисками? • СХД не хочет обращаться к диску • Кэш в оперативной памяти контроллера • Flash-кэш второго уровня • Предиктивное чтение • СХД избегает случайной записи • Писать полными страйпами • RAID Penalty = (N+1) / N, где N – число дисков
  • 16. Не все данные одинаково полезны
  • 17. Flash cache • Кэш второго уровня • Энергонезависим • В сотни раз больше оперативного • В десятки раз быстрее магнитных дисков • Две реализации логики • Read-only • Read/Write • Две аппаратных реализации • Специализированная PCI карта • Стандартный диск SSD (EFD)
  • 18. Контроль и управляемость • Мониторинг • Мощный встроенный мониторинг • Интеграция с корпоративными системами мониторинга
  • 19. Контроль и управляемость • Мониторинг • Мощный встроенный мониторинг • Интеграция с корпоративными системами мониторинга • Quality of Service (QoS) • Спасение от «шумного соседа» • Гарантия производительности • Ограничение по производительности
  • 21. Многоуровневое хранение (tiering) • В большинстве случаев – оптимизация по стоимости • Холодные данные на дешевые, но емкие носители • Перемещение данных 1 раз в сутки • Большой размер блока (256 МБ) • Улучшение производительности • Для систем с большим запасом вычислительной мощности • Hi End • Гиперконвергентные системы и SDS
  • 22. Многоуровневое хранение (tiering) • Будьте внимательны • Реализация тиринга иногда специфична • Знайте свой профиль нагрузки • Тиринг вам может не помочь от слова СОВСЕМ • Маркетинг работает
  • 28. Снимки (snapshots) • Защита от логических сбоев • Развалилась БД • Удалили файл • Использование в качестве тестовой площадки • Тесты на реальных данных • Резервное копирование • Бэкап снимка, а не самих данных • Поддержка почти всеми СРК корпоративного класса
  • 29. Журналирование • Журнал • Отдельное хранилище данных • Циклично записывает все операции записи • Спасает от логических сбоев с высочайшей гранулярностью • Вплоть до единичной дисковой операции • Интегрируется с прикладным софтом (на конкретный commit)
  • 31. Репликация данных • Создание удаленной копии данных • Всегда схема Active-Passive • Cинхронная • <100 км • Идентичная копия • Асинхронная • Любые расстояния • Близко к идентичной
  • 32. Метрокластер • СХД в активном зеркале • Active-Active • Синхронная • <100 км • Приложение не знает где работает • Полная автоматика
  • 34. Что же делать? • Узнай свои данные и нагрузку • Сколько стоит простой бизнеса • Сколько стоит потеря данных • Насколько схема «сделай сам» в политике компании? • Справится ли компания с разработкой? • А с поддержкой? • А если вот ты персонально уйдешь из компании?
  • 35. Антон Жбанков • 8x VMware vExpert • VCP, MCITP • EMC Cloud Architect Expert • http://blog.vadmin.ru • anton.zhbankov@nutanix.com