Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Онлайн-форум hostobzor.ru _ Железо _ Винтокапец!

Автор: Anatoly Bogdanov 04.10.2011, 18:20

Коллеги, дамы анд господа, просто сочувствующие и любопытствующие!
Интересует инструментарий и статистика.
Статистика по количеству дохлых винтов, бренд, объём.
Инструментарий восстановления инфы с винтов, какой, программно-аппаратный?

ЗЫ один винт в месяц это много или мало?

Автор: Maxim Volgin 04.10.2011, 18:31

Если не горит в первые 6 месяцев живет как правило 4-5 лет. Больше не пробовал так как сервер морально устаревает. Сегейты летят чаше. Инструментарий делаю бекапы локально и на удаленный сервер.

Автор: Anatoly Bogdanov 04.10.2011, 21:40

Цитата(Maxim Volgin @ 04.10.2011, 19:31) *

Если не горит в первые 6 месяцев живет как правило 4-5 лет. Больше не пробовал так как сервер морально устаревает. Сегейты летят чаше. Инструментарий делаю бекапы локально и на удаленный сервер.

Инструментарий восстановления инфы с винтов Если быкапы делались 6 мес назад, то на фиг они нужны?

Автор: Ivan 04.10.2011, 22:12

ты про SATA или SAS?

SATA - около 100 серверов ~300 винтов, 2-3 винта в месяц.

Энтерпрайз серии, особенно сегейты дохнут реже. Самсунги дохнут все года за два. ВД - все года за 3, рапторы аналогично. Сегейты, особливо NS могут дожить до морального старения в благополучном виде. Хитачи чуть хуже сегейтов.

Объемы мне считать лень, если мне за это ничего не светит. Сейчас ставим терабайтники на замену всему.

SAS - около 30 серверов ~ 60 винтов. 2-3 винта в год.

SSD еще не дохли, используем штук 5 SLC, взял на пробу пару MLC - посмотрю на скорость запиливания.

Инфу с винтов еще не разу не востановливали ибо зеркала и бэкапы.

Автор: kpv 04.10.2011, 23:02

Цитата(Anatoly Bogdanov @ 04.10.2011, 22:40) *

Инструментарий восстановления инфы с винтов Если быкапы делались 6 мес назад, то на фиг они нужны?

Тогда инструмент называет "кол". На этот инструмент надо посадить того, кто не делает бэкапы.
Восстановление инфы со сдохшего винта лучше поручить профессионально занимающимся людям, но даже если делать это самому, то одного инструмента мало - надо знать устройство файловой системы, чтобы уметь это восстанавливать.

Автор: Anatoly Bogdanov 04.10.2011, 23:09

Цитата(kpv @ 05.10.2011, 00:02) *

Тогда инструмент называет "кол". На этот инструмент надо посадить того, кто не делает бэкапы.
Восстановление инфы со сдохшего винта лучше поручить профессионально занимающимся людям, но даже если делать это самому, то одного инструмента мало - надо знать устройство файловой системы, чтобы уметь это восстанавливать.

они уже пошли, друг у друга, по второму кругу, локти кусать cool.gif

в звезду и красную армию!!! по факту даже не лимитируем их, нетблин, бэкапы мы принципиально не делаем....

не спим, о бэкапах думаем biggrin.gif я тут прикинул =) у нас два хранилища общим объёмом 25-30 терра =) занято примерно на 20%

Автор: Незаметдинов Ринат 05.10.2011, 02:15

да очень похожие данные, вот некоторые факты из личной статистики:

- Seagate помирают чаще чем WD
- Бэды/ремапы и т.п. вылезают либо сразу (в первый месяц), либо через несколько лет
- через ~4 года помирают и WD
- старые харды 150-250Gb живут дольше (5лет в среднем), чем 500Gb
- а новые 1Tb отказывают еще быстрее, чем 500Gb
- хард с температурой (по данным smartcl) 20-25°С имеет больше шансов прожить весь гарантийный срок (~3года)
- такой же хард с температурой 30-35°C не доживает до конца гарантийного срока

P.S. Инструментарием пользоваться не приходится тьфу-тьфу-тьфу, благо везде mirror или raid10
P.P.S. один винт в месяц напрямую зависит от парка машин, в крупном ДЦ будет "капля в море", а в мелкой конторе на полтора сисадмина нереально много.

Автор: rustelekom 05.10.2011, 13:46

а что рейд. а если сдохнет контроллер? кирдык тогда вашим данным. вот сейчас прислали:

"Greetings! As you are most likely aware, our ********** Windows VPS node suffered a severe hardware failure early Saturday morning. After thorough investigation, we’ve determined that the incident was caused by a failed RAID controller. Unfortunately, that failed controller also seems to have corrupted a large portion of the file structure and data on the drives which directly led to the crash of the hardware node as crucial files were corrupted. All attempts over the last 48 hours via several means have failed to recover the data, including several very time consuming attempts to mount and extract the data using virtually every method at our disposal. Unfortunately, our efforts have not yielded any results and so at this time, we must pronounce the data on ******** a 100% loss due to corruption of the RAID10 array. While this is devastating for us, we understand that it is even more devastating for all of you. Hardware failures are unfortunately a part of dealing with physi!
cal servers and despite the precautions in place to prevent such occurences, it is unfortunately something that can and does happen to us as well as other hosting providers, and we want you to know that we do understand that doesn’t make them any less difficult to deal with. We sincerely value your business and we want to do what we can to help you through this. We will be extending our technical support services to you, whether you be managed or unmanaged, to help you to restore your servers should you have a backup or need other technical assistance. While these types of failures are very, very rare, they unfortunately do happen and we would like to ensure that each and every one of you are taken care of. Please contact us at your earliest convenience via ****** and we would be happy to provide any assistance we can. Thank you for your understanding, ********"

А бекапить впсную ноду сами понимаете как легко.
Что касается тулз -пару раз пытались R-Studio for Linux - мало чем помогает. А так в основном это сервисные службы со стоимостью от 2000 евро. Правда надо заметить что проб