26.4.06

SATA давит

В новостях на ixbt.com проскочило сообщение о том, что "корпорация EMC выпустила новое решение для резервного хранения данных на жестких дисках - CLARiiON DL210". Все бы ничего, как обычно, да только этот массив емкостью до 24 терабайт построен на SATA-дисках емкостью по 500 гигабайт.
Я уже давно намекал, что пора бы в качестве среднего решения строить RAID на SATA. Понятно, что RAID 1/0 это баловство, можно устроить и у себя на рабочей станции. А вот RAID 5... Причем, в данном случае скупиться не надо, можно начинать строить такой массив не на трех, а минимум на четырех-пяти дисках.
Причем, эксперимент можно начать с дисков чуть ли не по $60, потому что даже такие уже имеют поддержку NCQ, и минимальный объем такого массива получится (4-1)*80гиг = 240 гигабайт, чего вполне достаточно и для баз данных, и для файлового сервера.
Правда, надежность SATA на порядок ниже, чем у SCSI. Однако, если свести теорию вероятности (и наработку на отказ) к известному анекдоту про вопрос мужчине и женщине "какова вероятность, что выйдя на улицу, вы увидите динозавра?", то в отношении SCSI остается лишь смутная уверенность, что "это лучше".
Например, у SATA II дисков Hitachi сейчас наработка на отказ - 1 ошибка на 10^14 операций. У SCSI-дисков той же фирмы, обратите внимание - 10 ошибок на 10^16 операций. Почему пишут именно так, а не "1 на 10^15" - непонятно.

Кстати, только что прочитал, что существует RAID5E, который надежнее всем известного RAID 5 (обратите внимание на упоминание spare drive) . Главное, чтобы такие контроллеры были доступны.

Хотя, может, я это зря пишу, и поставщики серверов уже давно наладили выпуск моделей "среднего класса" с RAID 5 на SATA II ?

p.s. чуть не забыл - спору нет, SCSI пока быстрее при "параллельной записи", чем SATA. Но думаю, что SATA еще даст жару.

6 комментариев:

Mikhail Elashkin комментирует...

Эх, когда руки дойдут дописать книгу по железу...
Смотри, для оптимизации дисков есть четыре типа операций:
- последовательное чтение
- выборочное чтение
- последовательная запись
- выборочная запись
Скажем для задач хранилищ данных важнее всего производительность первого и второго типа.
Второй фактор - как СУБД умеет это делать. Не все СУБД одинаково полезны. Скажем DB2 очень сильна в "перемножении матриц" т.е. запросах типа звезда. А Oracle не силен в последовательном чтении.
Соответственно массив настраивают на эти операции.
Ну и анализ SQL запросов - что они делают больше всего.

Это некий базис настройки и построения массивов для производительных систем.

Остальное в книге )))

Eugene Danilenko комментирует...

Дима, такое уже давно делается производителями серверов. На младшие модели HP типа ML 110 ставятся SATA раиды уровня 0,1,5,10. И NAS HP делает на SATA винтах. Серия DL110, например.

И вот сюда например посмотри
http://www.nix.ru/autocatalog/controllers_3ware/4804418_48044.html

kdv комментирует...

Евгению:
да, я посмотрел несколько производителей, но пока все-таки больше популярен SCSI, причем SCSI RAID 1+0. Это я не по предложениям, а по тому, что люди покупают (в т.ч. в больших конторах).

Михаилу:
Недавно я делал специфический тест, с последовательным и случайным чтением, без использования кэша Win.
Пока результаты такие - SCSI проигрывает при последовательном чтении-записи. SATA проигрывает на random read/write. Иногда цифры очень странные, видимо, влияет комбинация драйвер-контроллер-диск.
Собираем статистику.

Кроме того, сейчас делаем тесты tpc-c, проверяем в том числе и дисковые подсистемы. Это уже пойдет в ibdeveloper.com.

Alex комментирует...

To Eugene Danilenko:
Могу сказать на собственной шкуре: был приобретен 3ware 8506-4LP PCI64, 4-port SATA RAID 0, 1, 10, 5 & JBOD
128Mb Cache.
На RAID 0 и на взгляд и по тестам разница с обычным бескэшевым Promise TX2200 всего 5-7%.
На RAID 5 на 4 винтах тоже сильно скорость не возросла - те же 7% относительно RAID 0 и практически равные результаты с Promise TX4 (тоже на 4 винтах).
Тестировалось время выполнения запросов к БД под FB 1.5.2.
Сложилось впечатление, что все тормозится интерфейсом PCI и т.к. тестировать под PCI64 просто не на чем, то подтвердить или опровергнуть это не могу ;-)

Eugene Danilenko комментирует...

2 alex
ну вообще говоря сравнивать раиды 0 с пятым вообще неправомерно. Сравнивать, так уж похожие. :)
Ну и на простой PCI сравнивать тоже что-то неправильно. Вы сами это заметили. Пропускная способность обычной PCI практически сравнялась с производительностью жестких дисков. Т.е. PCI - узкое место.

Yevgen комментирует...

Не SQL.RU в разделе Oracle часто обсуждается применение SATA массивов для хранения файлов СУБД Oracle. Тема обсуждалась не один раз. В итоге мне понравился ответ одного из участников наслушавшегося про прелести SATA массивов. Он сказал примерно следующее "Странно, но почемуто массив на старом Mylex, которому в обед 100 лет работает быстрей, чем свеже купленный SATA".
1.Ребята забудьте про SATA для серверов БД. Ну разве для бэкапов и может быть для слабонагруженных Read-Only варинтов.
2.Ребята забудьте про RAID-5.
В случае выхода диска из строя, ваше сервис будет не доступен пока массив полностью не перестроится, ибо производительность его в случае выхода диска падает катострофически. Среднее время перестройки массива 4 часа. Вам такой простой нужен? Мне нет.
В случае RAID10 эта ситуация не возникает вообще.
3. Конкретно про производителей.
Купили мы примерно года два тому назад HP MSA-20 (3 щт) для бэкап-сервера (примерно на 5ТБ( RAID-5 ADG).
Кроме матюков ничего хорошего сказать не могу, хотя остальное железо от HP( MSA-30 например вполне рабочее). Массив разваливался несколько раз. Все отлично, но не работает. Ничего внятного Сервис-центр сказать не мог, кроме поставте последние пачти и firmware.
Cейчас стоит вопрос чем это барахло заменить, потому что постоянно восстанавливать 2,5Тб можно ухекатся.