RUEN

High-Performance Hybrid Arrays (HPHA)

12.10.2011

Использование возможностей SSD-накопителей без необходимости изменения приложения.

С ростом потребностей приложений изменения в вычислительную архитектуру вносятся относительно простым путем. Регулярно обновляются процессоры, повышаются скорости сетевых  соединений, постоянно удваиваются объемы дисковых накопителей и т.д. Но, несмотря на все эти улучшения, приложениям и их пользователям требуется еще больше ресурсов. Во многих случаях «узким местом» становится скорость операций ввода-вывода.

Примеры:

  • Система обработки онлайновых транзакций часто ограничена скоростью обновления базы данных.
  • Производительность поискового алгоритма может зависеть от того, как часто различные структуры данных могут считываться с диска.
  • Количество пользователей, которые могут успешно зайти на web-сайт, зависит от того, как быстро обрабатываются его страницы.

Традиционный подход к решению проблемы – использование очень быстрых дисков, например, SAS-дисков с частотой вращения 15000об/мин. При этом используется так называемая технология ”short stroke” (короткий рабочий ход, когда в работе используются только внешние радиусы дисковых накопителей), при этом достигается наивысшая производительность, хотя при этом и приходится жертвовать емкостью ради скорости.

Именно по этой причине существуют два различных типа дисковых подсистем:

  • Высокопроизводительные решения сравнительно небольшой емкости, основанные на относительно большом количестве SAS-дисков.
  • Менее производительные, однако, более емкие, решения на базе SATA-дисков.

К счастью, архитектура Adaptec Unified Serial® работает с обоими типами решений, даже в рамках одного контроллера, и именно поэтому системные интеграторы предпочитают работать с продуктами Adaptec при построении гибких систем, которые должны выполнять широкий спектр задач по хранению данных.

Тем не менее, регулярно появляются технологии, которые позволяют радикально изменить формат построения вычислительных систем. Именно такой технологией являются твердотельные накопители (SSD).

По сравнению с обычными дисковыми накопителями (HDD), SSD-накопители характеризуются очень высокой производительностью и низкой латентностью, потребляют мало энергии и практически не требуют охлаждения. А разница весьма существенна: некоторые операции могут выполняться на SSD в сто и более раз быстрее по сравнению с жестким диском.

Где проигрываем?

У этих преимуществ, естественно, есть и цена. Сегодня SSD-накопители гораздо дороже, чем накопители с вращающимися дисками, даже если основываться на характеристике «цена за хра-нение 1ГБ данных». В результате, в большинстве случаев, полный перевод подсистемы хранения данных на SSD представляется попросту непрактичным, даже не смотря на потенциальные выгоды.И, тем не менее, комбинация вращающихся и твердотельных устройств представляется интересной и может быть весьма недорогой, особенно если измерять «стоимость операции ввода-вывода» или даже «уровень энергопотребления на операцию ввода-вывода».

Но как должно выглядеть такое гибридное решение?

Построение решения, совмещающего SSD и HDD, может выглядеть простым, и с точки зрения управления подсистемой хранения, так оно и есть. Те м не менее, для приложений появляется новая проблема: в лучшем случае, приложение «может знать» о том, что оно имеет дело с двумя разными типами дисков. В худшем, приложение не будет понимать, как разделять данные между SSD и HDD. В лучшем случае, придется использовать утилиты настройки приложений, оптимизирующие их производительность. Во многих же случаях, это придется делать не один раз – при создании системы, а постоянно, в ходе изменения и старения данных.

Технология High-Performance Hybrid Array (HPHA)

Лучшим вариантом решения была бы прозрачная интеграция SSD-накопителей в хранилище данных так, чтобы плюсы от этого были схожими с результатами тонкой настройки приложений фронтэнда. В этом случае, SSD будут использоваться как дополнение к традиционным дисковым накопителям, что и создает гибридное хранилище данных. Технология High Performance Hybrid Array от компании Adaptec делает такую ситуацию реальностью.Гибридные массивы используют SSD-накопители совместно с обычными дисковыми накопителями SATA и SAS: большие и расширяемые массивы данных на HDD совмещаются с плюсами SSD, которые характеризуются низкой латентностью, высоким количеством операций ввода-вывода (IOPs) и низким энергопотреблением. Такая комбинация позволяет реализовать решения с наилучшим соотношением «цена-производительность».В сердце каждого гибридного массива располагается контроллер, умеющий работать с SSD-дисками и использующий интеллектуальный алгоритм обработки данных, который распределяет данные между HDD и SSD без необходимости дополнительно настраивать приложения или операционные системы.Высокопроизводительные гибридные массивы (HPHA) построены на базе контроллеров семейств Unified Serial® (SATA/SAS) Series 5Z, Series 5 и Series 2 компании Adaptec. Они обеспечивают максимальную производительность при минимальных объемах капитальных и операционных затрат. В зависимости от требований к производительности и емкости, массив HPHA может состоять из любого количества недорогих и емких SATA-дисков, более произ-водительных SAS-дисков, а также SSD-дисков, что и составляет гибридный дисковый массив. При этом обеспечивается наименьшая стоимость хранения данных и операций ввода-вывода, а также наименьшее энергопотребление на операцию ввода-вывода.

Как работает HPHA-массив?

У SSD-накопителей несколько необычные характеристики производительности. Один SSD может сам по себе выполнять более 30 тысяч операций чтения в секунду – это в 100 раз больше, чем самый быстрый SAS-диск. Однако, производительность при записи, особенно при случайной записи небольшими блоками данных, иногда бывает даже медленнее, чем у обычных дисковых накопителей. Производительность SSD-накопителя может значительно изменяться в зависимости от степени фрагментации его блоков флэш-памяти. В результате, настройка приложений под SSD становится трудной для решения задачей.НPНA-массивы, использующие технологию Adaptec MaxIQ™, совмещают в себе один или несколько SSD-накопителей с любым количеством дисковых накопителей SATA или SAS, обеспечивая неизменно высокую производительность и надежность. При этом отсутствует какая-либо необходимость в дополнительной настройке или доработке приложений. Кэширующее ПО MaxIQ использует твердотельные диски как кэш ввода-вывода: «горячие» данные, доступ к которым осуществляется наиболее часто, копируется в кэш-пул на базе SSD, где скорость чтения в разы выше. «Холодные» данные, доступ к которым более редок, или которые часто пере-записываются, остаются на обычных дисках. Такой гибридный массив может обеспечивать почти 20 тысяч операций чтения в секунду, что, тем не менее, не влияет негативно на производите-льность операций записи.

maxIQ

Используемая Adaptec технология позволяет изучить «поведение» приложения с точки зрения ввода-вывода данных, а затем, взаимодействуя с оперативной памятью DRAM, SSD и дисковыми накопителями, определить, где лучше всего разместить данные, чтобы добиться наилучшей производительности.Изначально данные записываются на дисковые накопители и считываются с них как обычно. Но в ходе изучения «поведения» приложения, кэширующее ПО Adaptec начинает переносить часто считываемые («горячие») данные в кэш пул на SSD-диске для ускорения их дальнейшего чтения. По мере копирования «горячих» данных в SSD-пул они заменяют более старые «холодные» блоки данных, естественно адаптируясь к изменению данных во времени.После первого копирования данных в SSD-кэш пул, обновление данных происходит как на SSD, так и на обычных дисках, что поддерживает кэш-пул в актуальном состоянии. Если же обнаруживаются блоки данных, для которых использование SSD не является оптимальным, такие данные удаляются с SSD-накопителя, и в дело вступают алгоритмы, отвечающие за размещение данных на обычных жестких дисках. Все эти действия полностью прозрачны для операционной системы и всех выполняемых приложений.

Преимущества HPHA

Гибридные массивы HPHA с технологией Adaptec MaxIQ™ SSD Cache Performance обеспечивают следующие преимущества:

  • Снижение капитальных вложенийHPHA позволяют создавать такие хранилища данных, которые могут значительно увеличить производительность приложений и снизить время реакции системы. При этом не требуется замена всех накопителей на SSD. Это обеспечивает оптимальную стоимость операции ввода-вывода. Использование SSD в качестве только кэш-пула HPHA устраняет необходимость заниматься защитой данных на собственно SSD-носителях – не надо удваивать количество твердотельных дисков в вашей архитектуре хранения, чтобы обеспечить зеркалирование.
  • Снижение операционных затратИспользование HPHA также устраняет необходимость дополнительной настройки или доработки приложений, а также позволяет выполнять те же задачи (или даже их больший объем) на меньшем количестве более экономичных дисковых накопителей, что снижает затраты на электропитание и охлаждение.
  • Максимальная защита данныхВсе данные HPHA-массива в любом случае хранятся на жестких дисках с использованием годами проверенных алгоритмов защиты. Данные, хранящиеся в кэш-пуле на SSD-дисках, представляют собой копии данных с вращающихся дисков. В случае отказа SSD, его замена никак не повлияет на целостность данных.
  • Повышение надежности и стабильности работы SSDЗапись данных всегда осуществляется на HDD. Копирование их в SSD-кэш происходит только в том случае, если кэширующее ПО Adaptec определяет потенциальную выгоду этого для приложения. Это снижает количество операций записи на SSD и его фрагментацию. Таким образом, увеличивается жизненный цикл твердотельного накопителя и снижается риск скачков производительности.
  • Оптимизация приложенийHPHA оптимизируют работу приложений без вмешательства со стороны пользователя или дополнительной настройки приложений. Они работают с приложениями, не имеющими встроенных функций создания партиций данных или возможностей для настройки, и автоматически адаптируются к изменяющимся рабочим нагрузкам, временным зависимостям и «старению» поведения данных.

Пример сценария с расчетом общей стоимости (ТСО)

adaptec table

table2

Как видно, конфигурация хранилища данных с использованием HPHA имеет эквивалентную емкость и лучше по всем прочим критериям. Кроме того, емкость HPHA легко можно увеличить добавлением высокоемких SATA-дисков.

Вывод

От дата-центров и сред “облачных” вычислений постоянно требуется увеличение их производительности для того, чтобы эффективно работать с самыми мощными приложениями и большим количеством пользователей.Технология High Performance Hybrid Array компании Adaptec является идеальной для приложений, выполняющих большое количество операций чтения, таких как web-сервисы, файловые хранилища и базы данных. За счет совмещения SSD и HDD-накопителей SAS данная технология обеспечивает минимальную стоимость операции ввода-вывода и минимальную стоимость хранения гигабайта информации. Кэширующее ПО MaxIQ содержит запатентованный алгоритм Learned-Path Algorithm, при помощи которого определяются наиболее часто считываемые («горячие») данные. Эти данные копируются в кэш-пул на SSD, что позволяет получать к ним в дальнейшем более быстрый доступ. Такой гибридный массив может обеспечивать до 20000 операций чтения в секунду, без снижения количества операций записи, оставаясь совершенно прозрачным для операционной системы и выполняемых приложений.Являясь мировым лидером в области технологий ввода-вывода в течение 28 лет, компания Adaptec продолжает быть флагманом отрасли и продолжает разрабатывать инновационные высокопроизводительные решения, которые интеллектуально маршрутизируют, оптимизируют и защищают данные при их движении по каналам ввода-вывода.


Полезное