2. Распределённые ЦОДЦели создания
•
Катастрофоустойчивость
•
Непрерывность обработки
•
Мобильность приложений
•
Миграция систем
•
Наращивание производительности/ёмкости
•
Распределённые сервисы
•
Географически-локализованные сервисы
3. КатастрофоустойчивостьТочка восстановления и время восстановления
Время
Момент
катастрофы
Последняя резервная копия или пригодные данные
Системы восстановлены и работоспособны
Время восстановления
Точка восстановления
(Recovery point objective -RPO)
Меньше RPO/RTO
•
Больше $$$
•
Репликация
•
«Горячий резерв»
Больше RPO/RTO
•
Меньше $$$
•
Резервирование на ленту
•
«Холодный резерв»
«Нулевые» RPO/RTO–система непрерывной доступности
4.
Развитие кластеризации для защиты от сбоя сайта целиком
Кластерные системы типично требуют “растягивания” L2VLANмежду ЦОД
Некоторые приложения поддерживают кластеризацию через L3сеть
Heartbeat
Private LAN
Public LAN
VIP Cluster
Cluster A
Node 2
Cluster A
Node 1
Непрерывность бизнесаГеографически распределённые отказоустойчивые кластеры
5.
Мобильность виртуальных сервисов между разнесёнными сайтами
Требование «растягивания» VLANи обеспечения непрерывного доступа к LUN
Основа для управления облачной нагрузкой и её миграции между «облаками»
DC 1
DC 2
Core Network
ESX-A source
ESX-B target
DCI LAN extension
Cisco-VMware With EMC & NetApp Validated Design & Certification for Virtualized Workload Mobility
Мобильность виртуальных сервисовПеремещение VMмежду ЦОД
6. Влияние расстоянияЗадержка(latency)
Скорость света в вакууме ~300,000км/с
Скорость света в оптоволокне: ~200,000км/с
Задержка сигнала: ~5 мкс/км, RTT~10 мкс/км
Для сравнения:
Среднее время доступа на (быстром) шпиндельном диске ~2-3мс
Среднее время доступа на SSDдиске < 0.1мс
Максимальнаязадержка, допускаемая VMWareдляvMotion: 5 мс RTT (10 мс начиная с vSphere 5.1)
7. Распределённые ЦОДКлассификация по расстоянию
Расстояние –ключевой фактор
Ближе:
Выше производительность
Синхронная репликация
Проще коммуникации
Дальше:
Катастрофоусточивость
Распределение сервисов
Компромисс!
Кампус
1–2 km
Метро50-80 km
Региональное
(extended
Metro)
200-400km
Основной
ЦОД
Резервный
ЦОД
Катастрофо-
устойчивый
ЦОД
Гео
8. Распределённые ЦОДТехнологические элементы
Связь сетей передачи данных
L2/L3смежность
Мониторинг(heartbit)/синхронизация в кластере
Репликация по IP
Подключение к транспортной сети
Связь сетей хранения данных
Доступ к удаленным СХД/лентам
Репликация массивов по FC
Оптимальный путь трафика
10. Ограничено оптикой и BB_Credit
Влияние расстоянияВарианты объединения FibreChannel SAN
Темное Волокно
CWDM
DWDM
SONET/SDH
ЦОД
Кампус
Метро
Регион
Страна
Расстояние
Sync
Sync (1,2,4Gbps)
Sync (1,2Gbps + subrate)
Async(WAN,1/10Gbps)
FCIP
Ограничено оптикой и BB_Credit
Ограничено BB_Credit
Оптика
IP
Sync (1,2,4,10Gbps per λ)
Sync (Metro Eth)
Async
Земля
11. Влияние расстоянияЗадержка(latency)иFibreChannel
Буферные кредиты (BB_Credit) согласовываются между каждой парой соединённых устройств в фабрике
Один буфер под каждый FC фрейм независимо от размера фрейма
FCфреймы буферизуются промежуточными коммутаторами
Трафик на каждом соединении управляется получением фреймов Receiver Ready (R_RDY), передающая сторона может послать только определённое (BB_Credits) число фреймов прежде, чем приостановит передачу
FC Receive Buffers
Traffic Flow
BB_CreditFlow Control
FC Receive Buffers
2-8 BB_Credit
16-255 BB_Credit
2-8 BB_Credit
BB_CreditFlow Control
BB_CreditFlow Control
12. •
BB_Creditsнужны, чтобы «заполнить» соединение фреймами FC
•
Полный (2112 байт) FC фрейм имеет «длину» примерно 2 км на 1 Gbps, 1 км на 2 Gbps,1/2 км на 4 Gbps, 1/4 км на 8Gbps,1/8 км на 16 Gbps
•
Если BB_Creditsне хватает для данного расстояния –снижается произодительность, соединение простаивает
•
Число BB_Creditsопределяется оборудованием и его настройками
16 Km
1 Gbps FC
4 Gbps FC
~½ km per Frame
~2 km per Frame
2 Gbps FC
~1 km per Frame
8 Gbps FC
~¼ km per Frame
BB_Credits и расстояние
Влияние расстоянияЗадержка(latency)иFibreChannel
13. FCoEдля связи SAN между ЦОД? Да! C Nexus 7000/7000 и модулями F2E
Поддерживаемые расстояния для FCoEтранспорта:
Nexus 5500:до 3 км
Nexus 5600: до 20 км
Nexus 7000 с F2/F2Eкартами: до 80 кмс DWDMSFP+
Использование отдельных соединений для LAN и SAN трафика
До 80 км
Nexus 7000
Nexus 7000
Storage VDC
Storage VDC
Storage VDC
Storage VDC
14. FCIP: Fibre Channel over IP
Соединение «точка-точка» (туннель) между двумя FCIPустройствами
Используется TCP –могут использоваться механизмы оптимизации (WAAS)
Создаётся едингая FC фабрика (общий FSPFдомен)
Транспорт –IP сеть, в том числе и на большие расстояния
FCIP: IETFстандарт для связи FibreChannel SANчерезIP (RFCs3821 и 3643)
FC SAN
FC SAN
IP Network
FCIP Tunnel
15. Расширение SAN и Inter-VSANRouting (IVR)
Сбой на «транзитной» VSAN_20(оборудование или кабель) не нарушит трафик в VSAN_10или VSAN_30
Работает с любым транспортом (FC, SONET/SDH, DWDM/CWDM, FCIP)
Нужно, если данные VSANиспользуются для локальной обработки
VSAN_5-Site 1 Host Fabric
VSAN_10-Site 1 Replication Fabric
VSAN_20-Inter-site SAN Extension Fabric
VSAN_30-Site 2 Replication Fabric
Site 2
Site 1
LocalVSAN_5
TransitVSAN_20(IVR)
ReplicationVSAN_10
ReplicationVSAN_30
16. Синхронная репликация данных: Приложение получает подтверждение I/Oпосле его выполнения на обеих сторонах (zero RPO)
«Метро»расстояния
Асинхронная репликация данных: Приложение получает подтверждение I/Oпосле его выполнения на основном (локальном) диске, в то время как его коприрование на удалённый массив продолжается
Неограниченные расстояния
1
1
1
2
1
3
1
4
1
1
1
3
1
2
Synchronous
Data Replication
Asynchronous
Data Replication
Расширение SAN
Синхроннаяи асинхронная репликация
17.
SCSI протокол (FC) требует два round tripна операцию
Вносимая задержка операции 20μs/км, 100 км =2 мс
В зависимости от приложения синхронную репликацию, как правило ограничивают 50-100 км
I/O Acceleration«убирает»одинround-trip
1
2
1
2
Local Storage Array
RemoteStorage Array
250 μs: Rec_Ready?
250 μs : Wait for response?
250 μs: Senddata
250 μs : Wait for Ack?
50 км
1ms
Расширение SAN
Синхронная репликация
18. DC 1
DC 2
Core Network
Virtual Center
ESX-A source
ESX-B target
L2 extension for vMotionNetwork
Target
Volumes
Initiator
Доступ к СХД и связь ЦОД
Вариант 1 –разделяемая СХД
19. Core Network
DC 1
DC 2
Virtual Center
L2 extension for vMotionNetwork
ESX-A source
ESX-B target
Повышение произодительности с использованием WriteAccelerationна Cisco MDS
Доступ к СХД и связь ЦОД
Разделяемая СХД –использование Cisco IOAcceleration
20. Работа ускорения ввода/вывода
Ускорение синхронной репликации и резервирования на ленту: аналогичнные подходы
На работу с лентой дополнительно влияют особенности физического носителя и ограничения буферизации
Write Acceleration имитирует только Transfer Ready, Tape Acceleration имитирует Command Status
WRITE
XFER_RDY
XFER_RDY
Write Acceleration (WA)
Reduction in I/O Latency ~equal to one round trip time (RTT)
STATUS
WA
WA
DATA
WRITE-1
XFER_RDY
XFER_RDY
STATUS
DATA
Tape Acceleration (TA)
TA
TA
STATUS
WRITE-2
XFER_RDY
DATA
STATUS
XFER_RDY
STATUS
WRITE-1
WRITE-2
WRTfile mark
WRTfile mark
WRTfm sts
WRTfm sts
21. http://www.cisco.com/en/US/docs/solutions/Enterprise/Data_Center/DCI/4.0/Netapp/dciNetapp.html
Core Network
DC 1
DC 2
Virtual Center
L2 extension for vMotionNetwork
ESX-A source
ESX-B target
Доступ к СХД и связь ЦОД
Вариант 2 -NetAppFlexCache(Active/Cache)
Temp
Cache
1
?
Read
data
3
data
2
Read
2
FlexCacheне работает как отложенный кеш записи
FlexCacheподтверждает операцию только после подтверждения от СХД
Write
Write
4
ACK
ACK
data
data
22. ЦОДB
ЦОД A
Fibre Channel
Distributed Virtual Volume
Хосты на обеих сторонах одновременноимеют доступ к распределённым виртуальным томам
Непрерыная синхронизация
Запись защищается на обоих сайтах
Чтение –с кеша VPLEXили местного тома
Synchronous Latency
Доступ к СХД и связь ЦОД
Вариант 3 -EMC VPLEX Metro (Active/Active)
23. http://www.cisco.com/en/US/docs/solutions/Enterprise/DataCenter/DCI/4.0/ EMC/dciEmc.html
Core Network
Virtual Center
L2 extension for vMotionNetwork
ESX-A source
ESX-B target
VPLEX Virtual Layer
DC 1
DC 2
Initiator
Initiator
Target
VPLEX
Engine
EMC
VMAX
VPLEX
Engine
EMC
CLARiiON
Target
F
From the Host
F
From the Storage
LUNv
LUNv
SynchronousLatencyrequiments
~100 kms max
Доступ к СХД и связь ЦОД
Вариант 3 -EMC VPLEX Metro (Active/Active)
25. Влияние расстоянияПередачаданных
Стандартные интерфейсы 10Гбит/с:
10GBASE-LR–до 10 км
10GBASE-ER–до 40 км
10GBASE-ZR–до 80 км
Стандартные интерфейсы 40Гбит/с
40GBASE-LR4–до 10 км
Стандартные интерфейсы 100Гбит/с
100GBASE-LR4–до 10 км
100GBASE-ER4–до 40 км
DWDM–до 1000+ км при использовании оптического усиления, не ограничено при использовании регенерации
Через сеть (IP, MPLS…) -без ограничений
26. Связь сетей ЦОД != растягивание VLAN !
Много задач, требующихрастягивания подсетей:
Отказоустойчивые кластеры
Миграция виртуальных машин
-но это не значит, что вы всегдаобязаны растягивать VLAN:
Кластеризация на L3
Растягивание подсетей без растягиванияVLAN (LISP)
Катастрофоустойчивые ЦОДы –связь на L2 снижает степень изоляции
В любом случае, не забывайте про:
Маршрутизацию между ЦОД
Связь ЦОД с внешним миром –Интернетом или корпоративной магистралью
27. Ethernet
VSS & vPC, FabricPath?
Multi-Chassis EtherChannelдля связи пары ЦОД
FabricPathдля связи многих сайтов –обсуждение далее
По тёмной оптике или xWDM
“Технологии LAN"
IP
OTV
Внедрение наCE
Подходит длякорпоративных внедрений
Малая зависимость от транспорта –требуется только IP сеть
«Маршрутизация по MACадресам»
Растягивание VLANВарианты технологий
Транспорт
Критерииприменения
MPLS
EoMPLS & A-VPLS & H-VPLS
Внедрение на PE
Масштабирование и multi-tenancy
Возможно поверх GRE
Апробированный вариант, хорошо подходит SP
Подробнее –в следующих выступлениях
28. Оптимальный путьВ чём именно проблема?
Layer 3 Core
Access
Agg
Access
Agg
10.1.1.0/24 advertised into L3
Backup should main site go down
10.1.1.0/25 & 10.1.1.128/25 advertised into L3
DC A is the primary entry point
Node A
ESX
ESX
Virtual Machine
Virtual Machine
VMware
vCenter
Data Center 1
Data Center 2
29. Оптимальный путьХотелось бы так...
Access
Agg
Access
Agg
Node A
ESX
ESX
Virtual Machine
VMware
vCenter
Data Center 1
Data Center 2
Layer 3 Core
30. Исходящий трафик
Локализация FHRP
Входящий трафик
GSLB
—
Выбор сайта с помощью DNS
Route Health Injection (RHI)
—
Анонс /32 маршрутов на активные сервисы
Locator/ID Separation Protocol –LISP-VM
—
Маршрутизация до сервиса
Подробнее –в следующих сессиях
Оптимизация пути трафика
32. Распределённые ЦОДКампус –до нескольких км
•
Типичный сценарий –несколько ЦОД в комплексе зданий или на территории предприятия
•
Катастрофоустойчивость: минимальна
•
Связь LAN: оптоволокно 10GBASE-LR/40GBASE-LR4/100GBASE-LR4
•
Связь SAN: оптоволокно-LW
•
Оптимизация пути: не нужна
•
Рассмотривать как часть единого модульного ЦОД
33. Распределённые ЦОД «Метро» –несколько десятков (до 60-100) км
•
Типичный сценарий –«резервный ЦОД» в пределах города или «метро-области»
•
Катастрофоустойчивость: частично
•
Связь LAN: оптоволокно 10GBASE-ER/ZR/ DWDM,при необходимости-IP+OTVили MPLS/VPLS
•
Связь SAN: оптоволокноCWDM/DWDM, при необходимости-FCIP
•
Оптимизация пути: по возможности
•
При наличии возможности –использование «тёмного волокна» для LAN и SAN, синхронная репликация, технологии метрокластеров, Vmotion
34. Распределённые ЦОД «Регион» –до несколько сот (300-400) км
•
Типичный сценарий –«резервный ЦОД» в другом городе в пределах региона
•
Катастрофоустойчивость: значительная
•
Связь LAN: IP+OTVили MPLS/VPLS, DWDM(при наличии)
•
Связь SAN: FCIP, DWDM(при наличии)
•
Оптимизация пути: желательна
•
Может использоваться для ряда «метрокластерных» технологий (Vmotion). Асинхронная репликация или синхронная с ограничениями и дополнительными инструментами
35. Распределённые ЦОД «Гео» –многие сотни и тысячи км
•
Типичный сценарий –ЦОД на случай катастрофы (DR)в другом регионе страны
•
Катастрофоустойчивость: высокая
•
Связь LAN: IP+OTVили MPLS/VPLS-если требует технология кластера
•
Связь SAN: FCIP–если требует технология кластера
•
Оптимизация пути: необходима
•
Асинхронная репликация, «log shipping»или иные средства катастрофоустойчивости. Высокое время восстановления (часы и более). Непосредственная связь между ЦОД –только если требует технология геокластера
36. Пример: собственные ЦОД CiscoMetro-Virtual DC (MVDC)
Непрерывность обработки, катастрофоустойчивость и оптимальное использование
DC1
(Texas)
DC2(Texas)
“Disaster Recovery (DR)”
Катастрофоустойчивый
удалённый ЦОД (RTP)
“Operational Continuity”
Единая пара ЦОД
с локальной отказоустойчивостью
Метро-разнесение
(в пределах50 оптических миль)
Размещение непродуктивных приложений
Автоматическая смена функций при катастрофе
с помощью сервисных профилей Cisco UCS
Георазнесение (> 200 миль)
http://www.cisco.com/web/about/ciscoitatwork/data_center/docs/Cisco_IT_Raleigh_Dual_Purpose_Data_Center_Case_Study.pdf