Хостинг - Обзор: эпицентр русскоязычного хостинга

Здравствуйте, гость ( Вход | Регистрация )

> Винтокапец!, инструментарий
Anatoly Bogdanov
сообщение 04.10.2011, 18:20
Сообщение #1





Группа: Старые пользователи
Сообщений: 2,505
Регистрация: 18.07.2004
Из: RU, SPb
Пользователь №: 553


Репутация: 233


Коллеги, дамы анд господа, просто сочувствующие и любопытствующие!
Интересует инструментарий и статистика.
Статистика по количеству дохлых винтов, бренд, объём.
Инструментарий восстановления инфы с винтов, какой, программно-аппаратный?

ЗЫ один винт в месяц это много или мало?
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
3 страниц V  1 2 3 >  
Reply to this topicStart new topic
Ответов(1 - 29)
Maxim Volgin
сообщение 04.10.2011, 18:31
Сообщение #2





Группа: Старые пользователи
Сообщений: 448
Регистрация: 26.02.2008
Пользователь №: 7,018


Репутация: 197


Если не горит в первые 6 месяцев живет как правило 4-5 лет. Больше не пробовал так как сервер морально устаревает. Сегейты летят чаше. Инструментарий делаю бекапы локально и на удаленный сервер.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Anatoly Bogdanov
сообщение 04.10.2011, 21:40
Сообщение #3





Группа: Старые пользователи
Сообщений: 2,505
Регистрация: 18.07.2004
Из: RU, SPb
Пользователь №: 553


Репутация: 233


Цитата(Maxim Volgin @ 04.10.2011, 19:31) *

Если не горит в первые 6 месяцев живет как правило 4-5 лет. Больше не пробовал так как сервер морально устаревает. Сегейты летят чаше. Инструментарий делаю бекапы локально и на удаленный сервер.

Инструментарий восстановления инфы с винтов Если быкапы делались 6 мес назад, то на фиг они нужны?
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Ivan
сообщение 04.10.2011, 22:12
Сообщение #4


Отдыхаю


Группа: Старые пользователи
Сообщений: 3,533
Регистрация: 02.08.2002
Из: ЗАО "Рувеб"
Пользователь №: 35


Репутация: 260


ты про SATA или SAS?

SATA - около 100 серверов ~300 винтов, 2-3 винта в месяц.

Энтерпрайз серии, особенно сегейты дохнут реже. Самсунги дохнут все года за два. ВД - все года за 3, рапторы аналогично. Сегейты, особливо NS могут дожить до морального старения в благополучном виде. Хитачи чуть хуже сегейтов.

Объемы мне считать лень, если мне за это ничего не светит. Сейчас ставим терабайтники на замену всему.

SAS - около 30 серверов ~ 60 винтов. 2-3 винта в год.

SSD еще не дохли, используем штук 5 SLC, взял на пробу пару MLC - посмотрю на скорость запиливания.

Инфу с винтов еще не разу не востановливали ибо зеркала и бэкапы.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
kpv
сообщение 04.10.2011, 23:02
Сообщение #5


DELEGATED, VERIFIED


Группа: Старые пользователи
Сообщений: 913
Регистрация: 10.03.2005
Из: Рувеба
Пользователь №: 1,129


Репутация: 237


Цитата(Anatoly Bogdanov @ 04.10.2011, 22:40) *

Инструментарий восстановления инфы с винтов Если быкапы делались 6 мес назад, то на фиг они нужны?

Тогда инструмент называет "кол". На этот инструмент надо посадить того, кто не делает бэкапы.
Восстановление инфы со сдохшего винта лучше поручить профессионально занимающимся людям, но даже если делать это самому, то одного инструмента мало - надо знать устройство файловой системы, чтобы уметь это восстанавливать.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Anatoly Bogdanov
сообщение 04.10.2011, 23:09
Сообщение #6





Группа: Старые пользователи
Сообщений: 2,505
Регистрация: 18.07.2004
Из: RU, SPb
Пользователь №: 553


Репутация: 233


Цитата(kpv @ 05.10.2011, 00:02) *

Тогда инструмент называет "кол". На этот инструмент надо посадить того, кто не делает бэкапы.
Восстановление инфы со сдохшего винта лучше поручить профессионально занимающимся людям, но даже если делать это самому, то одного инструмента мало - надо знать устройство файловой системы, чтобы уметь это восстанавливать.

они уже пошли, друг у друга, по второму кругу, локти кусать (IMG:style_emoticons/default/cool.gif)

в звезду и красную армию!!! по факту даже не лимитируем их, нетблин, бэкапы мы принципиально не делаем....

не спим, о бэкапах думаем (IMG:style_emoticons/default/biggrin.gif) я тут прикинул =) у нас два хранилища общим объёмом 25-30 терра =) занято примерно на 20%
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Незаметдинов Ринат
сообщение 05.10.2011, 02:15
Сообщение #7





Группа: Старые пользователи
Сообщений: 185
Регистрация: 29.10.2006
Из: Moscow
Пользователь №: 4,022


Репутация: 214


да очень похожие данные, вот некоторые факты из личной статистики:

- Seagate помирают чаще чем WD
- Бэды/ремапы и т.п. вылезают либо сразу (в первый месяц), либо через несколько лет
- через ~4 года помирают и WD
- старые харды 150-250Gb живут дольше (5лет в среднем), чем 500Gb
- а новые 1Tb отказывают еще быстрее, чем 500Gb
- хард с температурой (по данным smartcl) 20-25°С имеет больше шансов прожить весь гарантийный срок (~3года)
- такой же хард с температурой 30-35°C не доживает до конца гарантийного срока

P.S. Инструментарием пользоваться не приходится тьфу-тьфу-тьфу, благо везде mirror или raid10
P.P.S. один винт в месяц напрямую зависит от парка машин, в крупном ДЦ будет "капля в море", а в мелкой конторе на полтора сисадмина нереально много.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
rustelekom
сообщение 05.10.2011, 13:46
Сообщение #8


Эксперт раздела претензий


Группа: Старые пользователи
Сообщений: 3,604
Регистрация: 17.07.2002
Из: Москва
Пользователь №: 15


Репутация: 271


а что рейд. а если сдохнет контроллер? кирдык тогда вашим данным. вот сейчас прислали:

"Greetings! As you are most likely aware, our ********** Windows VPS node suffered a severe hardware failure early Saturday morning. After thorough investigation, we’ve determined that the incident was caused by a failed RAID controller. Unfortunately, that failed controller also seems to have corrupted a large portion of the file structure and data on the drives which directly led to the crash of the hardware node as crucial files were corrupted. All attempts over the last 48 hours via several means have failed to recover the data, including several very time consuming attempts to mount and extract the data using virtually every method at our disposal. Unfortunately, our efforts have not yielded any results and so at this time, we must pronounce the data on ******** a 100% loss due to corruption of the RAID10 array. While this is devastating for us, we understand that it is even more devastating for all of you. Hardware failures are unfortunately a part of dealing with physi!
cal servers and despite the precautions in place to prevent such occurences, it is unfortunately something that can and does happen to us as well as other hosting providers, and we want you to know that we do understand that doesn’t make them any less difficult to deal with. We sincerely value your business and we want to do what we can to help you through this. We will be extending our technical support services to you, whether you be managed or unmanaged, to help you to restore your servers should you have a backup or need other technical assistance. While these types of failures are very, very rare, they unfortunately do happen and we would like to ensure that each and every one of you are taken care of. Please contact us at your earliest convenience via ****** and we would be happy to provide any assistance we can. Thank you for your understanding, ********"

А бекапить впсную ноду сами понимаете как легко.
Что касается тулз -пару раз пытались R-Studio for Linux - мало чем помогает. А так в основном это сервисные службы со стоимостью от 2000 евро. Правда надо заметить что проблемные диски были с ext3.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Ivan
сообщение 05.10.2011, 21:29
Сообщение #9


Отдыхаю


Группа: Старые пользователи
Сообщений: 3,533
Регистрация: 02.08.2002
Из: ЗАО "Рувеб"
Пользователь №: 35


Репутация: 260


что бы не дох контроллер, неча ставить апаратные рейды (IMG:style_emoticons/default/smile.gif) ну или держать в резерве железяку.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Anatoly Bogdanov
сообщение 05.10.2011, 23:13
Сообщение #10





Группа: Старые пользователи
Сообщений: 2,505
Регистрация: 18.07.2004
Из: RU, SPb
Пользователь №: 553


Репутация: 233


Цитата(Незаметдинов Ринат @ 05.10.2011, 03:15) *

один винт в месяц напрямую зависит от парка машин, в крупном ДЦ будет "капля в море", а в мелкой конторе на полтора сисадмина нереально много.

больше сотни, в некоторых по два-четыре воткнуто.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
kpv
сообщение 06.10.2011, 11:59
Сообщение #11


DELEGATED, VERIFIED


Группа: Старые пользователи
Сообщений: 913
Регистрация: 10.03.2005
Из: Рувеба
Пользователь №: 1,129


Репутация: 237


Цитата(Ivan @ 05.10.2011, 22:29) *

апаратные рейды (IMG:style_emoticons/default/smile.gif) ну или держать в резерве железяку.

к тому времени когда дохнет аппаратная железка:
- железка, лежащая в резерве, уже настолько морально устарела, что нередко получается выкинутые деньги на ветер, по сравнению с тем, что можно купить новое.
- есть очень ненулевой риск, что железка не запустится
- такой железки уже давно нет в продаже, и даже если обратиться по гарантии, то вендор всё равно взамен предлагает другую железку.


В условиях аренды рейда в датацентре - смысл ещё какой-то есть, так как больше вероятность, что найдётся работающая платформа на замену.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Lolth
сообщение 23.10.2011, 00:54
Сообщение #12





Группа: Старые пользователи
Сообщений: 160
Регистрация: 21.10.2011
Пользователь №: 16,151


Репутация: 177


По своему опыту - хитачи живут дольше и не "чихают" в процессе,как это было с сегейтами.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
iwant2beahoster
сообщение 07.11.2011, 12:09
Сообщение #13





Группа: Старые пользователи
Сообщений: 65
Регистрация: 22.10.2011
Из: Прага
Пользователь №: 16,176


Репутация: 176


А как вы мониторите SSD диски чтобы узнать когда они готовятся умирать?
Дело в том что я видел SMART информацию с 32 Gb SSD дисков Korsair и понял что там отображается полная чушь.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Ivan
сообщение 07.11.2011, 18:15
Сообщение #14


Отдыхаю


Группа: Старые пользователи
Сообщений: 3,533
Регистрация: 02.08.2002
Из: ЗАО "Рувеб"
Пользователь №: 35


Репутация: 260


У интелей смарты получше. А при зеркале момент смерти ссд не так страшен, главное не одновременно .
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
eSupport.org.ua
сообщение 07.11.2011, 18:47
Сообщение #15


Одесский сисадмин


Группа: Старые пользователи
Сообщений: 5,200
Регистрация: 18.11.2004
Из: Одесса
Пользователь №: 823


Репутация: 262


CDP от R1Soft решение проблемы
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Lolth
сообщение 07.11.2011, 19:30
Сообщение #16





Группа: Старые пользователи
Сообщений: 160
Регистрация: 21.10.2011
Пользователь №: 16,151


Репутация: 177


Цитата(eSupport.org.ua @ 07.11.2011, 18:47) *

CDP от R1Soft решение проблемы

И на сколько хватает этого решения? Чем оно лучше?
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
freehoster
сообщение 08.11.2011, 05:34
Сообщение #17





Группа: Старые пользователи
Сообщений: 159
Регистрация: 26.10.2011
Из: Москва
Пользователь №: 16,335


Репутация: 177


ну раньше были макстор жесткие, по ним классно было ориентироваться, головой стучит - через месяц а то и больше смерть...хотя некоторые модели голвами постукивают, но упорно пашут уже 2й если не третий год!
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
iwant2beahoster
сообщение 10.11.2011, 13:44
Сообщение #18





Группа: Старые пользователи
Сообщений: 65
Регистрация: 22.10.2011
Из: Прага
Пользователь №: 16,176


Репутация: 176


Мой знакомый столкнулся с проблемой такого плана что ssd диск работает
но в некоторых местах записываемое не соответствует читаемому. Видимо отсутствует контроль по чётности. Либо контроль чётности сбоит аналогичным образом и отключается. Так что винт читается на ура. А вот в случае зеркала из двух винтов непонятно кому верить. Очевидно требуется третий для записи чётности.

Винт проработал чуть больше года.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
altura.ru
сообщение 11.11.2011, 04:08
Сообщение #19





Группа: Старые пользователи
Сообщений: 175
Регистрация: 22.01.2007
Пользователь №: 4,915


Репутация: 204


Интересная тема.

Большенство винтов у нас в цоде SATA Seagate.

Вообще в этом месяце подохло несколько винтов все NS серии! Годиков им по 5-6 Аналогичные винты обычных серий (7200 AS) живут...
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
iwant2beahoster
сообщение 13.11.2011, 03:25
Сообщение #20





Группа: Старые пользователи
Сообщений: 65
Регистрация: 22.10.2011
Из: Прага
Пользователь №: 16,176


Репутация: 176


А как вы принимаете решение что пора менять винт?
Достаточно ли информации SMART типа Realocated count или Pending count если одно из этих значений стало отличаться от нуля?

Как в случае ещё гарантийного диска и как в случае того у которого гарантия вышла.

Например винт гарантийный а вот сегодня на нём выскочил Realocated count = 1
Снимаем бежим пока гарантия не вышла?
А когда гарантия давно вышла ждёте пока не заполнится половина запасной области?
Но ведь это снижает скорость работы диска.

Какой стратегии вы придерживаетесь?
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
eSupport.org.ua
сообщение 13.11.2011, 17:36
Сообщение #21


Одесский сисадмин


Группа: Старые пользователи
Сообщений: 5,200
Регистрация: 18.11.2004
Из: Одесса
Пользователь №: 823


Репутация: 262


raid+backup наше все
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
iwant2beahoster
сообщение 14.11.2011, 00:50
Сообщение #22





Группа: Старые пользователи
Сообщений: 65
Регистрация: 22.10.2011
Из: Прага
Пользователь №: 16,176


Репутация: 176


Цитата(eSupport.org.ua @ 13.11.2011, 17:36) *
raid+backup наше все

Это как понимать? Винт меняете когда он совсем мертвый? (IMG:style_emoticons/default/smile.gif)
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
eSupport.org.ua
сообщение 14.11.2011, 13:20
Сообщение #23


Одесский сисадмин


Группа: Старые пользователи
Сообщений: 5,200
Регистрация: 18.11.2004
Из: Одесса
Пользователь №: 823


Репутация: 262


Это понять как "от смерти одного винта ничего страшного не происходит"
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
kpv
сообщение 14.11.2011, 13:59
Сообщение #24


DELEGATED, VERIFIED


Группа: Старые пользователи
Сообщений: 913
Регистрация: 10.03.2005
Из: Рувеба
Пользователь №: 1,129


Репутация: 237


страх наступает после смерти (IMG:style_emoticons/default/smile.gif)
типа такого:
техподдержка: о ужас, у нас сдохло 12 винтов из 13 в нашем супер-пупер рейде, срочно меняем сдохшие винты, иначе всё навернётся!!!
снабжение:такие винты уже давно не в моде и вообще в таиланде наводнение, винтов не будет до весны
финотдел: когда вы нам отремонируете наш клиент банк, тогда и оплатим счёт на новые железки
директор: уволю всех или продам в рабство


Сообщение отредактировал kpv - 14.11.2011, 14:05
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
iwant2beahoster
сообщение 17.11.2011, 02:11
Сообщение #25





Группа: Старые пользователи
Сообщений: 65
Регистрация: 22.10.2011
Из: Прага
Пользователь №: 16,176


Репутация: 176


Цитата(kpv @ 14.11.2011, 13:59) *

страх наступает после смерти (IMG:style_emoticons/default/smile.gif)
типа такого:
техподдержка: о ужас, у нас сдохло 12 винтов из 13 в нашем супер-пупер рейде, срочно меняем сдохшие винты, иначе всё навернётся!!!
....

Вот в этом то и дело.
Я понял что мониторить SMART в рейде придумали психи. А нормальные пацаны ставят рейды, с батарейками, по 3 винта в зеркало. И шевелиться начинают только тогда, когда 2 винта уже сгорели, а последний начал сыпаться. И обнаружили это случайно, когда клиент 7 дней подряд матом крыл техсаппорт, что у него фигня какая-то с хостингом творится. (IMG:style_emoticons/default/rolleyes.gif)

Батарейка в рейде тоже лишней выглядит, мало того что её нужно тренировать иногда, так ещё и портится, а это значит лишний раз оторвать попу от стула и бежать в холод. И вдруг наводнение на заводе батареек. Или землетрясение. А нет батарейки - нет и проблемы. (IMG:style_emoticons/default/laugh.gif)

Собственно вопрос звучал так:
Является ли relocation couter сигналом к замене винта?
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Maxim Volgin
сообщение 17.11.2011, 12:58
Сообщение #26





Группа: Старые пользователи
Сообщений: 448
Регистрация: 26.02.2008
Пользователь №: 7,018


Репутация: 197


Рейды не юзаю принципиально. Всегда имею резервный сервер. И переношу на него когда имею ошибки в dmesg. Но бекапы: на локалный диск на отделенный сервер и в офис. За 10 лет бекапы понадобились 2 раза а так все или почти все получалось перелить со старого.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
eSupport.org.ua
сообщение 17.11.2011, 13:35
Сообщение #27


Одесский сисадмин


Группа: Старые пользователи
Сообщений: 5,200
Регистрация: 18.11.2004
Из: Одесса
Пользователь №: 823


Репутация: 262


Цитата(kpv @ 14.11.2011, 13:59) *

страх наступает после смерти (IMG:style_emoticons/default/smile.gif)
типа такого:
техподдержка: о ужас, у нас сдохло 12 винтов из 13 в нашем супер-пупер рейде, срочно меняем сдохшие винты, иначе всё навернётся!!!
снабжение:такие винты уже давно не в моде и вообще в таиланде наводнение, винтов не будет до весны
финотдел: когда вы нам отремонируете наш клиент банк, тогда и оплатим счёт на новые железки
директор: уволю всех или продам в рабство


Директор виноват. Он не подумал о том, чтоб надо было купить запас винтов заранее.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
DCUA
сообщение 17.11.2011, 16:36
Сообщение #28





Группа: Старые пользователи
Сообщений: 734
Регистрация: 05.06.2003
Из: Украина, Харьков
Пользователь №: 193


Репутация: 241


Цитата(Maxim Volgin @ 17.11.2011, 11:58) *

Рейды не юзаю принципиально. Всегда имею резервный сервер. И переношу на него когда имею ошибки в dmesg. Но бекапы: на локалный диск на отделенный сервер и в офис. За 10 лет бекапы понадобились 2 раза а так все или почти все получалось перелить со старого.


Было время, я тоже так думал.
И как, я скажу, было приятно поменять пару винтов, но уже без всей той тягомотины и нервов с восстановлением.


Цитата(iwant2beahoster @ 17.11.2011, 01:11) *

Батарейка в рейде тоже лишней выглядит, мало того что её нужно тренировать иногда, так ещё и портится, а это значит лишний раз оторвать попу от стула и бежать в холод. И вдруг наводнение на заводе батареек. Или землетрясение. А нет батарейки - нет и проблемы. (IMG:style_emoticons/default/laugh.gif)


Батарейка - это действительно опция.
Она ведь только для кеширования записи интересна, или нет ?
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
kpv
сообщение 17.11.2011, 20:42
Сообщение #29


DELEGATED, VERIFIED


Группа: Старые пользователи
Сообщений: 913
Регистрация: 10.03.2005
Из: Рувеба
Пользователь №: 1,129


Репутация: 237


Цитата(iwant2beahoster @ 17.11.2011, 03:11) *

Является ли relocation couter=1 сигналом к замене винта?


нет.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
kpv
сообщение 17.11.2011, 21:22
Сообщение #30


DELEGATED, VERIFIED


Группа: Старые пользователи
Сообщений: 913
Регистрация: 10.03.2005
Из: Рувеба
Пользователь №: 1,129


Репутация: 237


Там счётчик пороговый. Есть ремап область, в которой определенное количество секторов. Надо сравнивать значение в столбце VALUE с значением в THRESH (в смарте), если близко или ниже THRESH - тогда меняем. в RAW в этот момент можете увидеть примерный размер ремапа.
поглядывайте на разницу между Reallocated Sectors Count и Reallocation Event Count.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post

3 страниц V  1 2 3 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 



- Текстовая версия Сейчас: 19.03.2024, 10:23
Яндекс.Метрика