понедельник, 22 февраля 2016 г.

Программно-определяемое хранение. Microsoft Windows Server 2012R2

Microsoft не так давно вышла на тропу программно-определяемого хранения. Ее стандартная серверная ОС Windows Server 2012 R2 - экономное и функционально привлекательное конвергентное решение для вычислений и хранения данных. О подрыве рынка традиционных SAN гремучей смесью Storage Spaces, SAS JBOD, SMB 3.0 и RDMA говорить рано, но с нагрузкой Hyper-V / SQL кластеры под WS 2012 R2 справляются хорошо.

RAID. С технологией Storage Spaces политики 2-way  или 3-way mirror обеспечивают производительность на уровне аппаратного RAID 10.

Spaces. Виртуальные диски, собранные из логических пулов SSD/HDD, дают пользователю лучшее от обоих типов: большую емкость HDD под холодные данные, производительность SSD под горячие данные. Поддерживается динамическое выделение емкости.

Automatic tiering. В двухуровневой схеме хранения SSD/HDD файловая система в фоновом режиме отслеживает обращения к блокам данных и по графику (раз в сутки или чаще - если надо) перемещает популярные блоки на быстрый слой (SSD), с гранулярностью 1MB.

Write-back cache. Сглаживает пики записи на виртуальный диск силами SSD из пула, повышая показатели IOPS.

SMB 3.0. Сетевой протокол, дающий приложениям доступ к данным стороннего сервера. Совместно используемые файлы презентуются всем узлам кластера Scale-Out File Server (SOFS). При отказах клиентское приложение автоматически обслуживается выжившими узлами. Microsoft рекомендует использовать сетевые адаптеры прямого доступа к памяти RDMA для разгрузки процессоров серверов и снижения задержек доступа к данным. Приложения могут работать с совместными файлами в кластере почти так же быстро, как с локальными дисками.

Доступность данных. Непрерывность файловых служб обеспечивает SOFS. Кластер серверов обращается за данными в общие контейнеры, Shared SAS JBOD.

Shared SAS JBOD. Общие хранилища для кластера серверов на дисках SSD/HDD. Емкость увеличивается добавлением в JBOD самых обычных дисков NL SAS, а когда место закончилось - новых JBOD c дисками целиком (могут понадобиться SAS-коммутаторы, они недорогие). В промышленных СХД даже сами диски обойдутся дороже: HDD в разы, SSD – на порядок.

В Windows Server 2016 появятся синхронная репликация и распределенное хранение на локальных дисках кластера серверов Storage Spaces Direct.


вторник, 16 февраля 2016 г.

Программно-определяемое хранение объемных данных. RAIDIX

Показательна история создания RAIDIX - ОС для нагруженных СХД. Все началось с отраслевой задачи: понадобилось прикрутить быстрый алгоритма RAID-стека к хранению файлов видеопроизводства, где данных (очень) много, критична производительность и особенно важна стабильная, без гребенок и провалов, скорость потоковой записи в хранилища. Дисковые массивы под видео перелопачивают десятки и сотни терабайт данных, без выраженного «горячего» ядра классических систем хранения. Теряя диски большой емкости, традиционные RAID’ы проваливают производительность и восстанавливаются сутками – что увеличивает риски потерь контента.

Помимо основной задачи на старте проекта, быстрого декодирования данных, разработчикам пришлось бороться c просаживанием скорости при выходе диска из строя, в схемах с двумя и более избыточными накопителями. А заодно и с «тихими» ошибками HDD (silent corruption) – обнаружением скрытых дефектов данных на чтение и их исправлением. 

Сегодня такие SDS используют в медийной индустрии, в HPC, для работы с объемными архивами изображений. 

Рекордная производительность. Уникальный алгоритм расчета контрольных сумм RAID оптимален для интенсивной потоковой нагрузки.

Unified Storage. Поддержка файлового (NAS по 10-40Гбит Ethernet) и блочного доступа (FC, iSCSI, Infiniband).

RAID с тройной четностью. Восстанавливает данные утраченных трех дисков без потери производительности. 

Отказоустойчивый кластер. Поддерживается режим Active-Active, при котором два узла кластера работают одновременно и имеют доступ к единому набору дисков. На переключение хостов уходят секунды.

Скрытые ошибки. Выявление и коррекция скрытых  ошибок дисков, вероятность появления которых на большом объеме хранения велика.


понедельник, 15 февраля 2016 г.

Программно-определяемое хранение объемных данных. Open-E Jovian DSS


К активным хранилищам данных большого объема нужен особый подход, из-за высоких требований к производительности и непрерывности. Одноконтроллерные решения плохи рисками простоя, аппаратные СХД специального назначения всегда дороги, распределенные системы вносят большие сетевые задержки и раздувают накладные расходы размещением нескольких копий данных.  

Open-E Jovian DSS – программное обеспечение для корпоративных хранилищ на основе Linux и файловой системы ZFS. Встроенная поддержка ZFS гибридных пулов RAM / SSD / HDD позволяет сбалансировать производительность и емкость хранения. Объем набирается недорогими дисками NL SAS, ядро горячих данных обслуживают RAM и SSD. 

Предлагаются сопутствующие объемным данным сервисы: динамическое выделение емкости, снэпшоты, сжатие, дедупликация. Хранилища встраиваются в NAS и SAN окружение по 10/40 Гигабит Ethernet.


Целевые рынки: тяжелые базы данных с интенсивным I/O-трафиком, облачный хостинг, хранение и раздача медийного контента. Для кластера высокой доступности данных c NFS- и iSCSI-подключением в минимальной конфигурации достаточно двух серверов на процессорах Intel Xeon E5 26xx и SAS JBOD разделяемого доступа.

Масштабируемость. 128-битная файловая система ZFS не ограничивает емкость хранения, с томами размером до зетабайта, на произвольном количестве дисков. В кластерах хранения JBOD с большим количеством емких дисков подключают по 6-12 Гбит SAS к управляющим серверам.

Сохранность данных. Массивы RAID переносят отказ до трех дисков одновременно. Поддерживается неограниченное количество снэпшотов – опция из разряда must have в эффективных сценариях восстановления данных. Активируется удаленно через командную строку.

Многослойное кэширование. Вместе с файловой системой унаследованы алгоритмы кэширования. Популярные файлы отправляются в одну из категорий «часто используемые» и «недавнего обращения» - раздельные области кэширования в оперативной памяти RAM серверных узлов и на SSD.

Гибридные пулы хранения. Утилизуют I/O-производительность SSD и высокую емкость HDD в единой логике управления.

Сжатие данных и дедупликация “на лету”. Экономия места на дисках, снижение накладных расходов по хранению. В таких системах коэффициент дедупликации может достигать 3:1 – когда для записи 3 ТБ данных достаточно 1ТБ физического пространства на дисках.

Динамическое выделение емкости (thin provisioning). Виртуальное выделение дискового пространства позволяет наращивать емкость хранилища без переформатирования. Избавляет от перерасхода дисков, их можно докупать и вводить в оборот данных по надобности.

Оптимизация под окружение. Серверы легко адаптируются под внешнюю нагрузку и набор сервисов. Подбор процессоров, объема RAM, пулов SSD, cетевых интерфейсов 10-40 Гб Ethernet позволяет парировать самые тяжелые запросы и предоставляет доступ к данным в широкополосном диапазоне, с минимальными задержками.