Винтокапец!, инструментарий |
Здравствуйте, гость ( Вход | Регистрация )
Винтокапец!, инструментарий |
Anatoly Bogdanov |
04.10.2011, 18:20
Сообщение
#1
|
Группа: Старые пользователи Сообщений: 2,505 Регистрация: 18.07.2004 Из: RU, SPb Пользователь №: 553 Репутация: 236 |
Коллеги, дамы анд господа, просто сочувствующие и любопытствующие!
Интересует инструментарий и статистика. Статистика по количеству дохлых винтов, бренд, объём. Инструментарий восстановления инфы с винтов, какой, программно-аппаратный? ЗЫ один винт в месяц это много или мало? |
Maxim Volgin |
04.10.2011, 18:31
Сообщение
#2
|
Группа: Старые пользователи Сообщений: 448 Регистрация: 26.02.2008 Пользователь №: 7,018 Репутация: 200 |
Если не горит в первые 6 месяцев живет как правило 4-5 лет. Больше не пробовал так как сервер морально устаревает. Сегейты летят чаше. Инструментарий делаю бекапы локально и на удаленный сервер.
|
Anatoly Bogdanov |
04.10.2011, 21:40
Сообщение
#3
|
Группа: Старые пользователи Сообщений: 2,505 Регистрация: 18.07.2004 Из: RU, SPb Пользователь №: 553 Репутация: 236 |
Если не горит в первые 6 месяцев живет как правило 4-5 лет. Больше не пробовал так как сервер морально устаревает. Сегейты летят чаше. Инструментарий делаю бекапы локально и на удаленный сервер. Инструментарий восстановления инфы с винтов Если быкапы делались 6 мес назад, то на фиг они нужны? |
Ivan |
04.10.2011, 22:12
Сообщение
#4
|
Отдыхаю Группа: Старые пользователи Сообщений: 3,533 Регистрация: 02.08.2002 Из: ЗАО "Рувеб" Пользователь №: 35 Репутация: 263 |
ты про SATA или SAS?
SATA - около 100 серверов ~300 винтов, 2-3 винта в месяц. Энтерпрайз серии, особенно сегейты дохнут реже. Самсунги дохнут все года за два. ВД - все года за 3, рапторы аналогично. Сегейты, особливо NS могут дожить до морального старения в благополучном виде. Хитачи чуть хуже сегейтов. Объемы мне считать лень, если мне за это ничего не светит. Сейчас ставим терабайтники на замену всему. SAS - около 30 серверов ~ 60 винтов. 2-3 винта в год. SSD еще не дохли, используем штук 5 SLC, взял на пробу пару MLC - посмотрю на скорость запиливания. Инфу с винтов еще не разу не востановливали ибо зеркала и бэкапы. |
kpv |
04.10.2011, 23:02
Сообщение
#5
|
DELEGATED, VERIFIED Группа: Старые пользователи Сообщений: 913 Регистрация: 10.03.2005 Из: Рувеба Пользователь №: 1,129 Репутация: 240 |
Инструментарий восстановления инфы с винтов Если быкапы делались 6 мес назад, то на фиг они нужны? Тогда инструмент называет "кол". На этот инструмент надо посадить того, кто не делает бэкапы. Восстановление инфы со сдохшего винта лучше поручить профессионально занимающимся людям, но даже если делать это самому, то одного инструмента мало - надо знать устройство файловой системы, чтобы уметь это восстанавливать. |
Anatoly Bogdanov |
04.10.2011, 23:09
Сообщение
#6
|
Группа: Старые пользователи Сообщений: 2,505 Регистрация: 18.07.2004 Из: RU, SPb Пользователь №: 553 Репутация: 236 |
Тогда инструмент называет "кол". На этот инструмент надо посадить того, кто не делает бэкапы. Восстановление инфы со сдохшего винта лучше поручить профессионально занимающимся людям, но даже если делать это самому, то одного инструмента мало - надо знать устройство файловой системы, чтобы уметь это восстанавливать. они уже пошли, друг у друга, по второму кругу, локти кусать (IMG:style_emoticons/default/cool.gif) в звезду и красную армию!!! по факту даже не лимитируем их, нетблин, бэкапы мы принципиально не делаем.... не спим, о бэкапах думаем (IMG:style_emoticons/default/biggrin.gif) я тут прикинул =) у нас два хранилища общим объёмом 25-30 терра =) занято примерно на 20% |
Незаметдинов Ринат |
05.10.2011, 02:15
Сообщение
#7
|
Группа: Старые пользователи Сообщений: 185 Регистрация: 29.10.2006 Из: Moscow Пользователь №: 4,022 Репутация: 217 |
да очень похожие данные, вот некоторые факты из личной статистики:
- Seagate помирают чаще чем WD - Бэды/ремапы и т.п. вылезают либо сразу (в первый месяц), либо через несколько лет - через ~4 года помирают и WD - старые харды 150-250Gb живут дольше (5лет в среднем), чем 500Gb - а новые 1Tb отказывают еще быстрее, чем 500Gb - хард с температурой (по данным smartcl) 20-25°С имеет больше шансов прожить весь гарантийный срок (~3года) - такой же хард с температурой 30-35°C не доживает до конца гарантийного срока P.S. Инструментарием пользоваться не приходится тьфу-тьфу-тьфу, благо везде mirror или raid10 P.P.S. один винт в месяц напрямую зависит от парка машин, в крупном ДЦ будет "капля в море", а в мелкой конторе на полтора сисадмина нереально много. |
rustelekom |
05.10.2011, 13:46
Сообщение
#8
|
Эксперт раздела претензий Группа: Старые пользователи Сообщений: 3,604 Регистрация: 17.07.2002 Из: Москва Пользователь №: 15 Репутация: 274 |
а что рейд. а если сдохнет контроллер? кирдык тогда вашим данным. вот сейчас прислали:
"Greetings! As you are most likely aware, our ********** Windows VPS node suffered a severe hardware failure early Saturday morning. After thorough investigation, we’ve determined that the incident was caused by a failed RAID controller. Unfortunately, that failed controller also seems to have corrupted a large portion of the file structure and data on the drives which directly led to the crash of the hardware node as crucial files were corrupted. All attempts over the last 48 hours via several means have failed to recover the data, including several very time consuming attempts to mount and extract the data using virtually every method at our disposal. Unfortunately, our efforts have not yielded any results and so at this time, we must pronounce the data on ******** a 100% loss due to corruption of the RAID10 array. While this is devastating for us, we understand that it is even more devastating for all of you. Hardware failures are unfortunately a part of dealing with physi! cal servers and despite the precautions in place to prevent such occurences, it is unfortunately something that can and does happen to us as well as other hosting providers, and we want you to know that we do understand that doesn’t make them any less difficult to deal with. We sincerely value your business and we want to do what we can to help you through this. We will be extending our technical support services to you, whether you be managed or unmanaged, to help you to restore your servers should you have a backup or need other technical assistance. While these types of failures are very, very rare, they unfortunately do happen and we would like to ensure that each and every one of you are taken care of. Please contact us at your earliest convenience via ****** and we would be happy to provide any assistance we can. Thank you for your understanding, ********" А бекапить впсную ноду сами понимаете как легко. Что касается тулз -пару раз пытались R-Studio for Linux - мало чем помогает. А так в основном это сервисные службы со стоимостью от 2000 евро. Правда надо заметить что проблемные диски были с ext3. |
Ivan |
05.10.2011, 21:29
Сообщение
#9
|
Отдыхаю Группа: Старые пользователи Сообщений: 3,533 Регистрация: 02.08.2002 Из: ЗАО "Рувеб" Пользователь №: 35 Репутация: 263 |
что бы не дох контроллер, неча ставить апаратные рейды (IMG:style_emoticons/default/smile.gif) ну или держать в резерве железяку.
|
Anatoly Bogdanov |
05.10.2011, 23:13
Сообщение
#10
|
Группа: Старые пользователи Сообщений: 2,505 Регистрация: 18.07.2004 Из: RU, SPb Пользователь №: 553 Репутация: 236 |
|
kpv |
06.10.2011, 11:59
Сообщение
#11
|
DELEGATED, VERIFIED Группа: Старые пользователи Сообщений: 913 Регистрация: 10.03.2005 Из: Рувеба Пользователь №: 1,129 Репутация: 240 |
к тому времени когда дохнет аппаратная железка: - железка, лежащая в резерве, уже настолько морально устарела, что нередко получается выкинутые деньги на ветер, по сравнению с тем, что можно купить новое. - есть очень ненулевой риск, что железка не запустится - такой железки уже давно нет в продаже, и даже если обратиться по гарантии, то вендор всё равно взамен предлагает другую железку. В условиях аренды рейда в датацентре - смысл ещё какой-то есть, так как больше вероятность, что найдётся работающая платформа на замену. |
Lolth |
23.10.2011, 00:54
Сообщение
#12
|
Группа: Старые пользователи Сообщений: 160 Регистрация: 21.10.2011 Пользователь №: 16,151 Репутация: 180 |
По своему опыту - хитачи живут дольше и не "чихают" в процессе,как это было с сегейтами.
|
iwant2beahoster |
07.11.2011, 12:09
Сообщение
#13
|
Группа: Старые пользователи Сообщений: 65 Регистрация: 22.10.2011 Из: Прага Пользователь №: 16,176 Репутация: 179 |
А как вы мониторите SSD диски чтобы узнать когда они готовятся умирать?
Дело в том что я видел SMART информацию с 32 Gb SSD дисков Korsair и понял что там отображается полная чушь. |
Ivan |
07.11.2011, 18:15
Сообщение
#14
|
Отдыхаю Группа: Старые пользователи Сообщений: 3,533 Регистрация: 02.08.2002 Из: ЗАО "Рувеб" Пользователь №: 35 Репутация: 263 |
У интелей смарты получше. А при зеркале момент смерти ссд не так страшен, главное не одновременно .
|
eSupport.org.ua |
07.11.2011, 18:47
Сообщение
#15
|
Одесский сисадмин Группа: Старые пользователи Сообщений: 5,200 Регистрация: 18.11.2004 Из: Одесса Пользователь №: 823 Репутация: 265 |
CDP от R1Soft решение проблемы
|
Lolth |
07.11.2011, 19:30
Сообщение
#16
|
Группа: Старые пользователи Сообщений: 160 Регистрация: 21.10.2011 Пользователь №: 16,151 Репутация: 180 |
|
freehoster |
08.11.2011, 05:34
Сообщение
#17
|
Группа: Старые пользователи Сообщений: 159 Регистрация: 26.10.2011 Из: Москва Пользователь №: 16,335 Репутация: 180 |
ну раньше были макстор жесткие, по ним классно было ориентироваться, головой стучит - через месяц а то и больше смерть...хотя некоторые модели голвами постукивают, но упорно пашут уже 2й если не третий год!
|
iwant2beahoster |
10.11.2011, 13:44
Сообщение
#18
|
Группа: Старые пользователи Сообщений: 65 Регистрация: 22.10.2011 Из: Прага Пользователь №: 16,176 Репутация: 179 |
Мой знакомый столкнулся с проблемой такого плана что ssd диск работает
но в некоторых местах записываемое не соответствует читаемому. Видимо отсутствует контроль по чётности. Либо контроль чётности сбоит аналогичным образом и отключается. Так что винт читается на ура. А вот в случае зеркала из двух винтов непонятно кому верить. Очевидно требуется третий для записи чётности. Винт проработал чуть больше года. |
altura.ru |
11.11.2011, 04:08
Сообщение
#19
|
Группа: Старые пользователи Сообщений: 175 Регистрация: 22.01.2007 Пользователь №: 4,915 Репутация: 207 |
Интересная тема.
Большенство винтов у нас в цоде SATA Seagate. Вообще в этом месяце подохло несколько винтов все NS серии! Годиков им по 5-6 Аналогичные винты обычных серий (7200 AS) живут... |
iwant2beahoster |
13.11.2011, 03:25
Сообщение
#20
|
Группа: Старые пользователи Сообщений: 65 Регистрация: 22.10.2011 Из: Прага Пользователь №: 16,176 Репутация: 179 |
А как вы принимаете решение что пора менять винт?
Достаточно ли информации SMART типа Realocated count или Pending count если одно из этих значений стало отличаться от нуля? Как в случае ещё гарантийного диска и как в случае того у которого гарантия вышла. Например винт гарантийный а вот сегодня на нём выскочил Realocated count = 1 Снимаем бежим пока гарантия не вышла? А когда гарантия давно вышла ждёте пока не заполнится половина запасной области? Но ведь это снижает скорость работы диска. Какой стратегии вы придерживаетесь? |
eSupport.org.ua |
13.11.2011, 17:36
Сообщение
#21
|
Одесский сисадмин Группа: Старые пользователи Сообщений: 5,200 Регистрация: 18.11.2004 Из: Одесса Пользователь №: 823 Репутация: 265 |
raid+backup наше все
|
iwant2beahoster |
14.11.2011, 00:50
Сообщение
#22
|
Группа: Старые пользователи Сообщений: 65 Регистрация: 22.10.2011 Из: Прага Пользователь №: 16,176 Репутация: 179 |
raid+backup наше все Это как понимать? Винт меняете когда он совсем мертвый? (IMG:style_emoticons/default/smile.gif) |
eSupport.org.ua |
14.11.2011, 13:20
Сообщение
#23
|
Одесский сисадмин Группа: Старые пользователи Сообщений: 5,200 Регистрация: 18.11.2004 Из: Одесса Пользователь №: 823 Репутация: 265 |
Это понять как "от смерти одного винта ничего страшного не происходит"
|
kpv |
14.11.2011, 13:59
Сообщение
#24
|
DELEGATED, VERIFIED Группа: Старые пользователи Сообщений: 913 Регистрация: 10.03.2005 Из: Рувеба Пользователь №: 1,129 Репутация: 240 |
страх наступает после смерти (IMG:style_emoticons/default/smile.gif)
типа такого: техподдержка: о ужас, у нас сдохло 12 винтов из 13 в нашем супер-пупер рейде, срочно меняем сдохшие винты, иначе всё навернётся!!! снабжение:такие винты уже давно не в моде и вообще в таиланде наводнение, винтов не будет до весны финотдел: когда вы нам отремонируете наш клиент банк, тогда и оплатим счёт на новые железки директор: уволю всех или продам в рабство Сообщение отредактировал kpv - 14.11.2011, 14:05 |
iwant2beahoster |
17.11.2011, 02:11
Сообщение
#25
|
Группа: Старые пользователи Сообщений: 65 Регистрация: 22.10.2011 Из: Прага Пользователь №: 16,176 Репутация: 179 |
страх наступает после смерти (IMG:style_emoticons/default/smile.gif) типа такого: техподдержка: о ужас, у нас сдохло 12 винтов из 13 в нашем супер-пупер рейде, срочно меняем сдохшие винты, иначе всё навернётся!!! .... Вот в этом то и дело. Я понял что мониторить SMART в рейде придумали психи. А нормальные пацаны ставят рейды, с батарейками, по 3 винта в зеркало. И шевелиться начинают только тогда, когда 2 винта уже сгорели, а последний начал сыпаться. И обнаружили это случайно, когда клиент 7 дней подряд матом крыл техсаппорт, что у него фигня какая-то с хостингом творится. (IMG:style_emoticons/default/rolleyes.gif) Батарейка в рейде тоже лишней выглядит, мало того что её нужно тренировать иногда, так ещё и портится, а это значит лишний раз оторвать попу от стула и бежать в холод. И вдруг наводнение на заводе батареек. Или землетрясение. А нет батарейки - нет и проблемы. (IMG:style_emoticons/default/laugh.gif) Собственно вопрос звучал так: Является ли relocation couter сигналом к замене винта? |
Maxim Volgin |
17.11.2011, 12:58
Сообщение
#26
|
Группа: Старые пользователи Сообщений: 448 Регистрация: 26.02.2008 Пользователь №: 7,018 Репутация: 200 |
Рейды не юзаю принципиально. Всегда имею резервный сервер. И переношу на него когда имею ошибки в dmesg. Но бекапы: на локалный диск на отделенный сервер и в офис. За 10 лет бекапы понадобились 2 раза а так все или почти все получалось перелить со старого.
|
eSupport.org.ua |
17.11.2011, 13:35
Сообщение
#27
|
Одесский сисадмин Группа: Старые пользователи Сообщений: 5,200 Регистрация: 18.11.2004 Из: Одесса Пользователь №: 823 Репутация: 265 |
страх наступает после смерти (IMG:style_emoticons/default/smile.gif) типа такого: техподдержка: о ужас, у нас сдохло 12 винтов из 13 в нашем супер-пупер рейде, срочно меняем сдохшие винты, иначе всё навернётся!!! снабжение:такие винты уже давно не в моде и вообще в таиланде наводнение, винтов не будет до весны финотдел: когда вы нам отремонируете наш клиент банк, тогда и оплатим счёт на новые железки директор: уволю всех или продам в рабство Директор виноват. Он не подумал о том, чтоб надо было купить запас винтов заранее. |
DCUA |
17.11.2011, 16:36
Сообщение
#28
|
Группа: Старые пользователи Сообщений: 734 Регистрация: 05.06.2003 Из: Украина, Харьков Пользователь №: 193 Репутация: 244 |
Рейды не юзаю принципиально. Всегда имею резервный сервер. И переношу на него когда имею ошибки в dmesg. Но бекапы: на локалный диск на отделенный сервер и в офис. За 10 лет бекапы понадобились 2 раза а так все или почти все получалось перелить со старого. Было время, я тоже так думал. И как, я скажу, было приятно поменять пару винтов, но уже без всей той тягомотины и нервов с восстановлением. Батарейка в рейде тоже лишней выглядит, мало того что её нужно тренировать иногда, так ещё и портится, а это значит лишний раз оторвать попу от стула и бежать в холод. И вдруг наводнение на заводе батареек. Или землетрясение. А нет батарейки - нет и проблемы. (IMG:style_emoticons/default/laugh.gif) Батарейка - это действительно опция. Она ведь только для кеширования записи интересна, или нет ? |
kpv |
17.11.2011, 20:42
Сообщение
#29
|
DELEGATED, VERIFIED Группа: Старые пользователи Сообщений: 913 Регистрация: 10.03.2005 Из: Рувеба Пользователь №: 1,129 Репутация: 240 |
|
kpv |
17.11.2011, 21:22
Сообщение
#30
|
DELEGATED, VERIFIED Группа: Старые пользователи Сообщений: 913 Регистрация: 10.03.2005 Из: Рувеба Пользователь №: 1,129 Репутация: 240 |
Там счётчик пороговый. Есть ремап область, в которой определенное количество секторов. Надо сравнивать значение в столбце VALUE с значением в THRESH (в смарте), если близко или ниже THRESH - тогда меняем. в RAW в этот момент можете увидеть примерный размер ремапа.
поглядывайте на разницу между Reallocated Sectors Count и Reallocation Event Count. |
Текстовая версия | Сейчас: 21.09.2024, 18:11 |