Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
SlideShare a Scribd company logo
Скороходов Александр 
Системный инженер-консультант 
askorokh@cisco.com 
Построение катастрофоустойчивых и распределённых ЦОДРешаемые задачи и элементы архитектуры 
25.11.2014 
© 2014 Cisco and/or its affiliates. All rights reserved.
Распределённые ЦОДЦели создания 
• 
Катастрофоустойчивость 
• 
Непрерывность обработки 
• 
Мобильность приложений 
• 
Миграция систем 
• 
Наращивание производительности/ёмкости 
• 
Распределённые сервисы 
• 
Географически-локализованные сервисы
КатастрофоустойчивостьТочка восстановления и время восстановления 
Время 
Момент 
катастрофы 
Последняя резервная копия или пригодные данные 
Системы восстановлены и работоспособны 
Время восстановления 
Точка восстановления 
(Recovery point objective -RPO) 
Меньше RPO/RTO 
• 
Больше $$$ 
• 
Репликация 
• 
«Горячий резерв» 
Больше RPO/RTO 
• 
Меньше $$$ 
• 
Резервирование на ленту 
• 
«Холодный резерв» 
«Нулевые» RPO/RTO–система непрерывной доступности
 
Развитие кластеризации для защиты от сбоя сайта целиком 
 
Кластерные системы типично требуют “растягивания” L2VLANмежду ЦОД 
 
Некоторые приложения поддерживают кластеризацию через L3сеть 
Heartbeat 
Private LAN 
Public LAN 
VIP Cluster 
Cluster A 
Node 2 
Cluster A 
Node 1 
Непрерывность бизнесаГеографически распределённые отказоустойчивые кластеры
 
Мобильность виртуальных сервисов между разнесёнными сайтами 
 
Требование «растягивания» VLANи обеспечения непрерывного доступа к LUN 
 
Основа для управления облачной нагрузкой и её миграции между «облаками» 
DC 1 
DC 2 
Core Network 
ESX-A source 
ESX-B target 
DCI LAN extension 
Cisco-VMware With EMC & NetApp Validated Design & Certification for Virtualized Workload Mobility 
Мобильность виртуальных сервисовПеремещение VMмежду ЦОД
Влияние расстоянияЗадержка(latency) 
Скорость света в вакууме ~300,000км/с 
Скорость света в оптоволокне: ~200,000км/с 
Задержка сигнала: ~5 мкс/км, RTT~10 мкс/км 
Для сравнения: 
 
Среднее время доступа на (быстром) шпиндельном диске ~2-3мс 
 
Среднее время доступа на SSDдиске < 0.1мс 
 
Максимальнаязадержка, допускаемая VMWareдляvMotion: 5 мс RTT (10 мс начиная с vSphere 5.1)
Распределённые ЦОДКлассификация по расстоянию 
Расстояние –ключевой фактор 
Ближе: 
 
Выше производительность 
 
Синхронная репликация 
 
Проще коммуникации 
Дальше: 
 
Катастрофоусточивость 
 
Распределение сервисов 
Компромисс! 
Кампус 
1–2 km 
Метро50-80 km 
Региональное 
(extended 
Metro) 
200-400km 
Основной 
ЦОД 
Резервный 
ЦОД 
Катастрофо- 
устойчивый 
ЦОД 
Гео
Распределённые ЦОДТехнологические элементы 
Связь сетей передачи данных 
 
L2/L3смежность 
 
Мониторинг(heartbit)/синхронизация в кластере 
 
Репликация по IP 
 
Подключение к транспортной сети 
Связь сетей хранения данных 
 
Доступ к удаленным СХД/лентам 
 
Репликация массивов по FC 
Оптимальный путь трафика
Связь сетей хранения данных
Ограничено оптикой и BB_Credit 
Влияние расстоянияВарианты объединения FibreChannel SAN 
Темное Волокно 
CWDM 
DWDM 
SONET/SDH 
ЦОД 
Кампус 
Метро 
Регион 
Страна 
Расстояние 
Sync 
Sync (1,2,4Gbps) 
Sync (1,2Gbps + subrate) 
Async(WAN,1/10Gbps) 
FCIP 
Ограничено оптикой и BB_Credit 
Ограничено BB_Credit 
Оптика 
IP 
Sync (1,2,4,10Gbps per λ) 
Sync (Metro Eth) 
Async 
Земля
Влияние расстоянияЗадержка(latency)иFibreChannel 
 
Буферные кредиты (BB_Credit) согласовываются между каждой парой соединённых устройств в фабрике 
 
Один буфер под каждый FC фрейм независимо от размера фрейма 
 
FCфреймы буферизуются промежуточными коммутаторами 
 
Трафик на каждом соединении управляется получением фреймов Receiver Ready (R_RDY), передающая сторона может послать только определённое (BB_Credits) число фреймов прежде, чем приостановит передачу 
FC Receive Buffers 
Traffic Flow 
BB_CreditFlow Control 
FC Receive Buffers 
2-8 BB_Credit 
16-255 BB_Credit 
2-8 BB_Credit 
BB_CreditFlow Control 
BB_CreditFlow Control
• 
BB_Creditsнужны, чтобы «заполнить» соединение фреймами FC 
• 
Полный (2112 байт) FC фрейм имеет «длину» примерно 2 км на 1 Gbps, 1 км на 2 Gbps,1/2 км на 4 Gbps, 1/4 км на 8Gbps,1/8 км на 16 Gbps 
• 
Если BB_Creditsне хватает для данного расстояния –снижается произодительность, соединение простаивает 
• 
Число BB_Creditsопределяется оборудованием и его настройками 
16 Km 
1 Gbps FC 
4 Gbps FC 
~½ km per Frame 
~2 km per Frame 
2 Gbps FC 
~1 km per Frame 
8 Gbps FC 
~¼ km per Frame 
BB_Credits и расстояние 
Влияние расстоянияЗадержка(latency)иFibreChannel
FCoEдля связи SAN между ЦОД? Да! C Nexus 7000/7000 и модулями F2E 
 
Поддерживаемые расстояния для FCoEтранспорта: 
 
Nexus 5500:до 3 км 
 
Nexus 5600: до 20 км 
 
Nexus 7000 с F2/F2Eкартами: до 80 кмс DWDMSFP+ 
 
Использование отдельных соединений для LAN и SAN трафика 
До 80 км 
Nexus 7000 
Nexus 7000 
Storage VDC 
Storage VDC 
Storage VDC 
Storage VDC
FCIP: Fibre Channel over IP 
Соединение «точка-точка» (туннель) между двумя FCIPустройствами 
Используется TCP –могут использоваться механизмы оптимизации (WAAS) 
Создаётся едингая FC фабрика (общий FSPFдомен) 
Транспорт –IP сеть, в том числе и на большие расстояния 
FCIP: IETFстандарт для связи FibreChannel SANчерезIP (RFCs3821 и 3643) 
FC SAN 
FC SAN 
IP Network 
FCIP Tunnel
Расширение SAN и Inter-VSANRouting (IVR) 
 
Сбой на «транзитной» VSAN_20(оборудование или кабель) не нарушит трафик в VSAN_10или VSAN_30 
 
Работает с любым транспортом (FC, SONET/SDH, DWDM/CWDM, FCIP) 
 
Нужно, если данные VSANиспользуются для локальной обработки 
VSAN_5-Site 1 Host Fabric 
VSAN_10-Site 1 Replication Fabric 
VSAN_20-Inter-site SAN Extension Fabric 
VSAN_30-Site 2 Replication Fabric 
Site 2 
Site 1 
LocalVSAN_5 
TransitVSAN_20(IVR) 
ReplicationVSAN_10 
ReplicationVSAN_30
Синхронная репликация данных: Приложение получает подтверждение I/Oпосле его выполнения на обеих сторонах (zero RPO) 
 
«Метро»расстояния 
Асинхронная репликация данных: Приложение получает подтверждение I/Oпосле его выполнения на основном (локальном) диске, в то время как его коприрование на удалённый массив продолжается 
 
Неограниченные расстояния 
1 
1 
1 
2 
1 
3 
1 
4 
1 
1 
1 
3 
1 
2 
Synchronous 
Data Replication 
Asynchronous 
Data Replication 
Расширение SAN 
Синхроннаяи асинхронная репликация
 
SCSI протокол (FC) требует два round tripна операцию 
 
Вносимая задержка операции 20μs/км, 100 км =2 мс 
 
В зависимости от приложения синхронную репликацию, как правило ограничивают 50-100 км 
 
I/O Acceleration«убирает»одинround-trip 
1 
2 
1 
2 
Local Storage Array 
RemoteStorage Array 
250 μs: Rec_Ready? 
250 μs : Wait for response? 
250 μs: Senddata 
250 μs : Wait for Ack? 
50 км 
1ms 
Расширение SAN 
Синхронная репликация
DC 1 
DC 2 
Core Network 
Virtual Center 
ESX-A source 
ESX-B target 
L2 extension for vMotionNetwork 
Target 
Volumes 
Initiator 
Доступ к СХД и связь ЦОД 
Вариант 1 –разделяемая СХД
Core Network 
DC 1 
DC 2 
Virtual Center 
L2 extension for vMotionNetwork 
ESX-A source 
ESX-B target 
Повышение произодительности с использованием WriteAccelerationна Cisco MDS 
Доступ к СХД и связь ЦОД 
Разделяемая СХД –использование Cisco IOAcceleration
Работа ускорения ввода/вывода 
Ускорение синхронной репликации и резервирования на ленту: аналогичнные подходы 
На работу с лентой дополнительно влияют особенности физического носителя и ограничения буферизации 
Write Acceleration имитирует только Transfer Ready, Tape Acceleration имитирует Command Status 
WRITE 
XFER_RDY 
XFER_RDY 
Write Acceleration (WA) 
Reduction in I/O Latency ~equal to one round trip time (RTT) 
STATUS 
WA 
WA 
DATA 
WRITE-1 
XFER_RDY 
XFER_RDY 
STATUS 
DATA 
Tape Acceleration (TA) 
TA 
TA 
STATUS 
WRITE-2 
XFER_RDY 
DATA 
STATUS 
XFER_RDY 
STATUS 
WRITE-1 
WRITE-2 
WRTfile mark 
WRTfile mark 
WRTfm sts 
WRTfm sts
http://www.cisco.com/en/US/docs/solutions/Enterprise/Data_Center/DCI/4.0/Netapp/dciNetapp.html 
Core Network 
DC 1 
DC 2 
Virtual Center 
L2 extension for vMotionNetwork 
ESX-A source 
ESX-B target 
Доступ к СХД и связь ЦОД 
Вариант 2 -NetAppFlexCache(Active/Cache) 
Temp 
Cache 
1 
? 
Read 
data 
3 
data 
2 
Read 
2 
 
FlexCacheне работает как отложенный кеш записи 
FlexCacheподтверждает операцию только после подтверждения от СХД 
Write 
Write 
4 
ACK 
ACK 
data 
data
ЦОДB 
ЦОД A 
Fibre Channel 
Distributed Virtual Volume 
 
Хосты на обеих сторонах одновременноимеют доступ к распределённым виртуальным томам 
Непрерыная синхронизация 
Запись защищается на обоих сайтах 
Чтение –с кеша VPLEXили местного тома 
Synchronous Latency 
Доступ к СХД и связь ЦОД 
Вариант 3 -EMC VPLEX Metro (Active/Active)
http://www.cisco.com/en/US/docs/solutions/Enterprise/DataCenter/DCI/4.0/ EMC/dciEmc.html 
Core Network 
Virtual Center 
L2 extension for vMotionNetwork 
ESX-A source 
ESX-B target 
VPLEX Virtual Layer 
DC 1 
DC 2 
Initiator 
Initiator 
Target 
VPLEX 
Engine 
EMC 
VMAX 
VPLEX 
Engine 
EMC 
CLARiiON 
Target 
F 
From the Host 
F 
From the Storage 
LUNv 
LUNv 
SynchronousLatencyrequiments 
~100 kms max 
Доступ к СХД и связь ЦОД 
Вариант 3 -EMC VPLEX Metro (Active/Active)
Связь сетей передачи данных
Влияние расстоянияПередачаданных 
Стандартные интерфейсы 10Гбит/с: 
 
10GBASE-LR–до 10 км 
 
10GBASE-ER–до 40 км 
 
10GBASE-ZR–до 80 км 
Стандартные интерфейсы 40Гбит/с 
 
40GBASE-LR4–до 10 км 
Стандартные интерфейсы 100Гбит/с 
 
100GBASE-LR4–до 10 км 
 
100GBASE-ER4–до 40 км 
DWDM–до 1000+ км при использовании оптического усиления, не ограничено при использовании регенерации 
Через сеть (IP, MPLS…) -без ограничений
Связь сетей ЦОД != растягивание VLAN ! 
Много задач, требующихрастягивания подсетей: 
 
Отказоустойчивые кластеры 
 
Миграция виртуальных машин 
-но это не значит, что вы всегдаобязаны растягивать VLAN: 
 
Кластеризация на L3 
 
Растягивание подсетей без растягиванияVLAN (LISP) 
 
Катастрофоустойчивые ЦОДы –связь на L2 снижает степень изоляции 
В любом случае, не забывайте про: 
 
Маршрутизацию между ЦОД 
 
Связь ЦОД с внешним миром –Интернетом или корпоративной магистралью
Ethernet 
 
VSS & vPC, FabricPath? 
Multi-Chassis EtherChannelдля связи пары ЦОД 
FabricPathдля связи многих сайтов –обсуждение далее 
По тёмной оптике или xWDM 
“Технологии LAN" 
IP 
 
OTV 
 
Внедрение наCE 
 
Подходит длякорпоративных внедрений 
 
Малая зависимость от транспорта –требуется только IP сеть 
 
«Маршрутизация по MACадресам» 
Растягивание VLANВарианты технологий 
Транспорт 
Критерииприменения 
MPLS 
 
EoMPLS & A-VPLS & H-VPLS 
 
Внедрение на PE 
 
Масштабирование и multi-tenancy 
 
Возможно поверх GRE 
 
Апробированный вариант, хорошо подходит SP 
Подробнее –в следующих выступлениях
Оптимальный путьВ чём именно проблема? 
Layer 3 Core 
Access 
Agg 
Access 
Agg 
10.1.1.0/24 advertised into L3 
Backup should main site go down 
10.1.1.0/25 & 10.1.1.128/25 advertised into L3 
DC A is the primary entry point 
Node A 
ESX 
ESX 
Virtual Machine 
Virtual Machine 
VMware 
vCenter 
Data Center 1 
Data Center 2
Оптимальный путьХотелось бы так... 
Access 
Agg 
Access 
Agg 
Node A 
ESX 
ESX 
Virtual Machine 
VMware 
vCenter 
Data Center 1 
Data Center 2 
Layer 3 Core
Исходящий трафик 
 
Локализация FHRP 
Входящий трафик 
 
GSLB 
— 
Выбор сайта с помощью DNS 
 
Route Health Injection (RHI) 
— 
Анонс /32 маршрутов на активные сервисы 
 
Locator/ID Separation Protocol –LISP-VM 
— 
Маршрутизация до сервиса 
Подробнее –в следующих сессиях 
Оптимизация пути трафика
Типы ЦОД и выбор подходов
Распределённые ЦОДКампус –до нескольких км 
• 
Типичный сценарий –несколько ЦОД в комплексе зданий или на территории предприятия 
• 
Катастрофоустойчивость: минимальна 
• 
Связь LAN: оптоволокно 10GBASE-LR/40GBASE-LR4/100GBASE-LR4 
• 
Связь SAN: оптоволокно-LW 
• 
Оптимизация пути: не нужна 
• 
Рассмотривать как часть единого модульного ЦОД
Распределённые ЦОД «Метро» –несколько десятков (до 60-100) км 
• 
Типичный сценарий –«резервный ЦОД» в пределах города или «метро-области» 
• 
Катастрофоустойчивость: частично 
• 
Связь LAN: оптоволокно 10GBASE-ER/ZR/ DWDM,при необходимости-IP+OTVили MPLS/VPLS 
• 
Связь SAN: оптоволокноCWDM/DWDM, при необходимости-FCIP 
• 
Оптимизация пути: по возможности 
• 
При наличии возможности –использование «тёмного волокна» для LAN и SAN, синхронная репликация, технологии метрокластеров, Vmotion
Распределённые ЦОД «Регион» –до несколько сот (300-400) км 
• 
Типичный сценарий –«резервный ЦОД» в другом городе в пределах региона 
• 
Катастрофоустойчивость: значительная 
• 
Связь LAN: IP+OTVили MPLS/VPLS, DWDM(при наличии) 
• 
Связь SAN: FCIP, DWDM(при наличии) 
• 
Оптимизация пути: желательна 
• 
Может использоваться для ряда «метрокластерных» технологий (Vmotion). Асинхронная репликация или синхронная с ограничениями и дополнительными инструментами
Распределённые ЦОД «Гео» –многие сотни и тысячи км 
• 
Типичный сценарий –ЦОД на случай катастрофы (DR)в другом регионе страны 
• 
Катастрофоустойчивость: высокая 
• 
Связь LAN: IP+OTVили MPLS/VPLS-если требует технология кластера 
• 
Связь SAN: FCIP–если требует технология кластера 
• 
Оптимизация пути: необходима 
• 
Асинхронная репликация, «log shipping»или иные средства катастрофоустойчивости. Высокое время восстановления (часы и более). Непосредственная связь между ЦОД –только если требует технология геокластера
Пример: собственные ЦОД CiscoMetro-Virtual DC (MVDC) 
Непрерывность обработки, катастрофоустойчивость и оптимальное использование 
DC1 
(Texas) 
DC2(Texas) 
“Disaster Recovery (DR)” 
Катастрофоустойчивый 
удалённый ЦОД (RTP) 
“Operational Continuity” 
Единая пара ЦОД 
с локальной отказоустойчивостью 
Метро-разнесение 
(в пределах50 оптических миль) 
Размещение непродуктивных приложений 
Автоматическая смена функций при катастрофе 
с помощью сервисных профилей Cisco UCS 
Георазнесение (> 200 миль) 
http://www.cisco.com/web/about/ciscoitatwork/data_center/docs/Cisco_IT_Raleigh_Dual_Purpose_Data_Center_Case_Study.pdf
Data Center InterconnectДополнительная информация 
http://www.cisco.com/go/dci
CiscoRu Cisco CiscoRussia 
Ждем ваших сообщений с хештегом 
#CiscoConnectRu 
Пожалуйста, используйте код для оценки доклада 
4418Ваше мнение очень важно для нас. 
Спасибо 
Скороходов Александр 
Phone: +7(495)789-8615 
E-mail: askorokh@cisco.com 25.11.2014 
© 2014 Cisco and/or its affiliates. All rights reserved.

More Related Content

Построение катастрофоустойчивых и распределённых ЦОД

  • 1. Скороходов Александр Системный инженер-консультант askorokh@cisco.com Построение катастрофоустойчивых и распределённых ЦОДРешаемые задачи и элементы архитектуры 25.11.2014 © 2014 Cisco and/or its affiliates. All rights reserved.
  • 2. Распределённые ЦОДЦели создания • Катастрофоустойчивость • Непрерывность обработки • Мобильность приложений • Миграция систем • Наращивание производительности/ёмкости • Распределённые сервисы • Географически-локализованные сервисы
  • 3. КатастрофоустойчивостьТочка восстановления и время восстановления Время Момент катастрофы Последняя резервная копия или пригодные данные Системы восстановлены и работоспособны Время восстановления Точка восстановления (Recovery point objective -RPO) Меньше RPO/RTO • Больше $$$ • Репликация • «Горячий резерв» Больше RPO/RTO • Меньше $$$ • Резервирование на ленту • «Холодный резерв» «Нулевые» RPO/RTO–система непрерывной доступности
  • 4.  Развитие кластеризации для защиты от сбоя сайта целиком  Кластерные системы типично требуют “растягивания” L2VLANмежду ЦОД  Некоторые приложения поддерживают кластеризацию через L3сеть Heartbeat Private LAN Public LAN VIP Cluster Cluster A Node 2 Cluster A Node 1 Непрерывность бизнесаГеографически распределённые отказоустойчивые кластеры
  • 5.  Мобильность виртуальных сервисов между разнесёнными сайтами  Требование «растягивания» VLANи обеспечения непрерывного доступа к LUN  Основа для управления облачной нагрузкой и её миграции между «облаками» DC 1 DC 2 Core Network ESX-A source ESX-B target DCI LAN extension Cisco-VMware With EMC & NetApp Validated Design & Certification for Virtualized Workload Mobility Мобильность виртуальных сервисовПеремещение VMмежду ЦОД
  • 6. Влияние расстоянияЗадержка(latency) Скорость света в вакууме ~300,000км/с Скорость света в оптоволокне: ~200,000км/с Задержка сигнала: ~5 мкс/км, RTT~10 мкс/км Для сравнения:  Среднее время доступа на (быстром) шпиндельном диске ~2-3мс  Среднее время доступа на SSDдиске < 0.1мс  Максимальнаязадержка, допускаемая VMWareдляvMotion: 5 мс RTT (10 мс начиная с vSphere 5.1)
  • 7. Распределённые ЦОДКлассификация по расстоянию Расстояние –ключевой фактор Ближе:  Выше производительность  Синхронная репликация  Проще коммуникации Дальше:  Катастрофоусточивость  Распределение сервисов Компромисс! Кампус 1–2 km Метро50-80 km Региональное (extended Metro) 200-400km Основной ЦОД Резервный ЦОД Катастрофо- устойчивый ЦОД Гео
  • 8. Распределённые ЦОДТехнологические элементы Связь сетей передачи данных  L2/L3смежность  Мониторинг(heartbit)/синхронизация в кластере  Репликация по IP  Подключение к транспортной сети Связь сетей хранения данных  Доступ к удаленным СХД/лентам  Репликация массивов по FC Оптимальный путь трафика
  • 10. Ограничено оптикой и BB_Credit Влияние расстоянияВарианты объединения FibreChannel SAN Темное Волокно CWDM DWDM SONET/SDH ЦОД Кампус Метро Регион Страна Расстояние Sync Sync (1,2,4Gbps) Sync (1,2Gbps + subrate) Async(WAN,1/10Gbps) FCIP Ограничено оптикой и BB_Credit Ограничено BB_Credit Оптика IP Sync (1,2,4,10Gbps per λ) Sync (Metro Eth) Async Земля
  • 11. Влияние расстоянияЗадержка(latency)иFibreChannel  Буферные кредиты (BB_Credit) согласовываются между каждой парой соединённых устройств в фабрике  Один буфер под каждый FC фрейм независимо от размера фрейма  FCфреймы буферизуются промежуточными коммутаторами  Трафик на каждом соединении управляется получением фреймов Receiver Ready (R_RDY), передающая сторона может послать только определённое (BB_Credits) число фреймов прежде, чем приостановит передачу FC Receive Buffers Traffic Flow BB_CreditFlow Control FC Receive Buffers 2-8 BB_Credit 16-255 BB_Credit 2-8 BB_Credit BB_CreditFlow Control BB_CreditFlow Control
  • 12. • BB_Creditsнужны, чтобы «заполнить» соединение фреймами FC • Полный (2112 байт) FC фрейм имеет «длину» примерно 2 км на 1 Gbps, 1 км на 2 Gbps,1/2 км на 4 Gbps, 1/4 км на 8Gbps,1/8 км на 16 Gbps • Если BB_Creditsне хватает для данного расстояния –снижается произодительность, соединение простаивает • Число BB_Creditsопределяется оборудованием и его настройками 16 Km 1 Gbps FC 4 Gbps FC ~½ km per Frame ~2 km per Frame 2 Gbps FC ~1 km per Frame 8 Gbps FC ~¼ km per Frame BB_Credits и расстояние Влияние расстоянияЗадержка(latency)иFibreChannel
  • 13. FCoEдля связи SAN между ЦОД? Да! C Nexus 7000/7000 и модулями F2E  Поддерживаемые расстояния для FCoEтранспорта:  Nexus 5500:до 3 км  Nexus 5600: до 20 км  Nexus 7000 с F2/F2Eкартами: до 80 кмс DWDMSFP+  Использование отдельных соединений для LAN и SAN трафика До 80 км Nexus 7000 Nexus 7000 Storage VDC Storage VDC Storage VDC Storage VDC
  • 14. FCIP: Fibre Channel over IP Соединение «точка-точка» (туннель) между двумя FCIPустройствами Используется TCP –могут использоваться механизмы оптимизации (WAAS) Создаётся едингая FC фабрика (общий FSPFдомен) Транспорт –IP сеть, в том числе и на большие расстояния FCIP: IETFстандарт для связи FibreChannel SANчерезIP (RFCs3821 и 3643) FC SAN FC SAN IP Network FCIP Tunnel
  • 15. Расширение SAN и Inter-VSANRouting (IVR)  Сбой на «транзитной» VSAN_20(оборудование или кабель) не нарушит трафик в VSAN_10или VSAN_30  Работает с любым транспортом (FC, SONET/SDH, DWDM/CWDM, FCIP)  Нужно, если данные VSANиспользуются для локальной обработки VSAN_5-Site 1 Host Fabric VSAN_10-Site 1 Replication Fabric VSAN_20-Inter-site SAN Extension Fabric VSAN_30-Site 2 Replication Fabric Site 2 Site 1 LocalVSAN_5 TransitVSAN_20(IVR) ReplicationVSAN_10 ReplicationVSAN_30
  • 16. Синхронная репликация данных: Приложение получает подтверждение I/Oпосле его выполнения на обеих сторонах (zero RPO)  «Метро»расстояния Асинхронная репликация данных: Приложение получает подтверждение I/Oпосле его выполнения на основном (локальном) диске, в то время как его коприрование на удалённый массив продолжается  Неограниченные расстояния 1 1 1 2 1 3 1 4 1 1 1 3 1 2 Synchronous Data Replication Asynchronous Data Replication Расширение SAN Синхроннаяи асинхронная репликация
  • 17.  SCSI протокол (FC) требует два round tripна операцию  Вносимая задержка операции 20μs/км, 100 км =2 мс  В зависимости от приложения синхронную репликацию, как правило ограничивают 50-100 км  I/O Acceleration«убирает»одинround-trip 1 2 1 2 Local Storage Array RemoteStorage Array 250 μs: Rec_Ready? 250 μs : Wait for response? 250 μs: Senddata 250 μs : Wait for Ack? 50 км 1ms Расширение SAN Синхронная репликация
  • 18. DC 1 DC 2 Core Network Virtual Center ESX-A source ESX-B target L2 extension for vMotionNetwork Target Volumes Initiator Доступ к СХД и связь ЦОД Вариант 1 –разделяемая СХД
  • 19. Core Network DC 1 DC 2 Virtual Center L2 extension for vMotionNetwork ESX-A source ESX-B target Повышение произодительности с использованием WriteAccelerationна Cisco MDS Доступ к СХД и связь ЦОД Разделяемая СХД –использование Cisco IOAcceleration
  • 20. Работа ускорения ввода/вывода Ускорение синхронной репликации и резервирования на ленту: аналогичнные подходы На работу с лентой дополнительно влияют особенности физического носителя и ограничения буферизации Write Acceleration имитирует только Transfer Ready, Tape Acceleration имитирует Command Status WRITE XFER_RDY XFER_RDY Write Acceleration (WA) Reduction in I/O Latency ~equal to one round trip time (RTT) STATUS WA WA DATA WRITE-1 XFER_RDY XFER_RDY STATUS DATA Tape Acceleration (TA) TA TA STATUS WRITE-2 XFER_RDY DATA STATUS XFER_RDY STATUS WRITE-1 WRITE-2 WRTfile mark WRTfile mark WRTfm sts WRTfm sts
  • 21. http://www.cisco.com/en/US/docs/solutions/Enterprise/Data_Center/DCI/4.0/Netapp/dciNetapp.html Core Network DC 1 DC 2 Virtual Center L2 extension for vMotionNetwork ESX-A source ESX-B target Доступ к СХД и связь ЦОД Вариант 2 -NetAppFlexCache(Active/Cache) Temp Cache 1 ? Read data 3 data 2 Read 2  FlexCacheне работает как отложенный кеш записи FlexCacheподтверждает операцию только после подтверждения от СХД Write Write 4 ACK ACK data data
  • 22. ЦОДB ЦОД A Fibre Channel Distributed Virtual Volume  Хосты на обеих сторонах одновременноимеют доступ к распределённым виртуальным томам Непрерыная синхронизация Запись защищается на обоих сайтах Чтение –с кеша VPLEXили местного тома Synchronous Latency Доступ к СХД и связь ЦОД Вариант 3 -EMC VPLEX Metro (Active/Active)
  • 23. http://www.cisco.com/en/US/docs/solutions/Enterprise/DataCenter/DCI/4.0/ EMC/dciEmc.html Core Network Virtual Center L2 extension for vMotionNetwork ESX-A source ESX-B target VPLEX Virtual Layer DC 1 DC 2 Initiator Initiator Target VPLEX Engine EMC VMAX VPLEX Engine EMC CLARiiON Target F From the Host F From the Storage LUNv LUNv SynchronousLatencyrequiments ~100 kms max Доступ к СХД и связь ЦОД Вариант 3 -EMC VPLEX Metro (Active/Active)
  • 25. Влияние расстоянияПередачаданных Стандартные интерфейсы 10Гбит/с:  10GBASE-LR–до 10 км  10GBASE-ER–до 40 км  10GBASE-ZR–до 80 км Стандартные интерфейсы 40Гбит/с  40GBASE-LR4–до 10 км Стандартные интерфейсы 100Гбит/с  100GBASE-LR4–до 10 км  100GBASE-ER4–до 40 км DWDM–до 1000+ км при использовании оптического усиления, не ограничено при использовании регенерации Через сеть (IP, MPLS…) -без ограничений
  • 26. Связь сетей ЦОД != растягивание VLAN ! Много задач, требующихрастягивания подсетей:  Отказоустойчивые кластеры  Миграция виртуальных машин -но это не значит, что вы всегдаобязаны растягивать VLAN:  Кластеризация на L3  Растягивание подсетей без растягиванияVLAN (LISP)  Катастрофоустойчивые ЦОДы –связь на L2 снижает степень изоляции В любом случае, не забывайте про:  Маршрутизацию между ЦОД  Связь ЦОД с внешним миром –Интернетом или корпоративной магистралью
  • 27. Ethernet  VSS & vPC, FabricPath? Multi-Chassis EtherChannelдля связи пары ЦОД FabricPathдля связи многих сайтов –обсуждение далее По тёмной оптике или xWDM “Технологии LAN" IP  OTV  Внедрение наCE  Подходит длякорпоративных внедрений  Малая зависимость от транспорта –требуется только IP сеть  «Маршрутизация по MACадресам» Растягивание VLANВарианты технологий Транспорт Критерииприменения MPLS  EoMPLS & A-VPLS & H-VPLS  Внедрение на PE  Масштабирование и multi-tenancy  Возможно поверх GRE  Апробированный вариант, хорошо подходит SP Подробнее –в следующих выступлениях
  • 28. Оптимальный путьВ чём именно проблема? Layer 3 Core Access Agg Access Agg 10.1.1.0/24 advertised into L3 Backup should main site go down 10.1.1.0/25 & 10.1.1.128/25 advertised into L3 DC A is the primary entry point Node A ESX ESX Virtual Machine Virtual Machine VMware vCenter Data Center 1 Data Center 2
  • 29. Оптимальный путьХотелось бы так... Access Agg Access Agg Node A ESX ESX Virtual Machine VMware vCenter Data Center 1 Data Center 2 Layer 3 Core
  • 30. Исходящий трафик  Локализация FHRP Входящий трафик  GSLB — Выбор сайта с помощью DNS  Route Health Injection (RHI) — Анонс /32 маршрутов на активные сервисы  Locator/ID Separation Protocol –LISP-VM — Маршрутизация до сервиса Подробнее –в следующих сессиях Оптимизация пути трафика
  • 31. Типы ЦОД и выбор подходов
  • 32. Распределённые ЦОДКампус –до нескольких км • Типичный сценарий –несколько ЦОД в комплексе зданий или на территории предприятия • Катастрофоустойчивость: минимальна • Связь LAN: оптоволокно 10GBASE-LR/40GBASE-LR4/100GBASE-LR4 • Связь SAN: оптоволокно-LW • Оптимизация пути: не нужна • Рассмотривать как часть единого модульного ЦОД
  • 33. Распределённые ЦОД «Метро» –несколько десятков (до 60-100) км • Типичный сценарий –«резервный ЦОД» в пределах города или «метро-области» • Катастрофоустойчивость: частично • Связь LAN: оптоволокно 10GBASE-ER/ZR/ DWDM,при необходимости-IP+OTVили MPLS/VPLS • Связь SAN: оптоволокноCWDM/DWDM, при необходимости-FCIP • Оптимизация пути: по возможности • При наличии возможности –использование «тёмного волокна» для LAN и SAN, синхронная репликация, технологии метрокластеров, Vmotion
  • 34. Распределённые ЦОД «Регион» –до несколько сот (300-400) км • Типичный сценарий –«резервный ЦОД» в другом городе в пределах региона • Катастрофоустойчивость: значительная • Связь LAN: IP+OTVили MPLS/VPLS, DWDM(при наличии) • Связь SAN: FCIP, DWDM(при наличии) • Оптимизация пути: желательна • Может использоваться для ряда «метрокластерных» технологий (Vmotion). Асинхронная репликация или синхронная с ограничениями и дополнительными инструментами
  • 35. Распределённые ЦОД «Гео» –многие сотни и тысячи км • Типичный сценарий –ЦОД на случай катастрофы (DR)в другом регионе страны • Катастрофоустойчивость: высокая • Связь LAN: IP+OTVили MPLS/VPLS-если требует технология кластера • Связь SAN: FCIP–если требует технология кластера • Оптимизация пути: необходима • Асинхронная репликация, «log shipping»или иные средства катастрофоустойчивости. Высокое время восстановления (часы и более). Непосредственная связь между ЦОД –только если требует технология геокластера
  • 36. Пример: собственные ЦОД CiscoMetro-Virtual DC (MVDC) Непрерывность обработки, катастрофоустойчивость и оптимальное использование DC1 (Texas) DC2(Texas) “Disaster Recovery (DR)” Катастрофоустойчивый удалённый ЦОД (RTP) “Operational Continuity” Единая пара ЦОД с локальной отказоустойчивостью Метро-разнесение (в пределах50 оптических миль) Размещение непродуктивных приложений Автоматическая смена функций при катастрофе с помощью сервисных профилей Cisco UCS Георазнесение (> 200 миль) http://www.cisco.com/web/about/ciscoitatwork/data_center/docs/Cisco_IT_Raleigh_Dual_Purpose_Data_Center_Case_Study.pdf
  • 37. Data Center InterconnectДополнительная информация http://www.cisco.com/go/dci
  • 38. CiscoRu Cisco CiscoRussia Ждем ваших сообщений с хештегом #CiscoConnectRu Пожалуйста, используйте код для оценки доклада 4418Ваше мнение очень важно для нас. Спасибо Скороходов Александр Phone: +7(495)789-8615 E-mail: askorokh@cisco.com 25.11.2014 © 2014 Cisco and/or its affiliates. All rights reserved.