Логин:
Пароль:
Сохранить логин и пароль
Для получения логина и пароля пишите на почту do@planetaklimata.com.ua
Страницы: 1 2 3 4 5 6 7 8 9 10



Сім основних причин, що призводять до простою дата-центру

(03.12.2015)

Коли ЦОД йде в оф-лайн, є три потенційних винуватця: люди, обладнання та природа.

Загрозу, яку дата-центр може представляти для людини, озвучив минулого тижня Ед Ансетт, голова групи i3 Solutions. Він сказав наступне: «Ми (індустрія дата-центрів) все ще на початку шляху. Початок летальних випадків в нашій галузі - це всього лише питання часу».

1. Вихід з ладу ДГУ

Ед, не розкриваючи імені потерпілого оператора, навів приклад серйозної аварії в дата-центрі, що сталася внаслідок неправильної роботи ДГУ.

Стояв жаркий літній день. Сталося відключення магістральної енергії. Дата-центр працював при повному навантаженні 7,2 МВт. Майданчик був обладнан чотирма генераторами по 2,5 МВт з резервуванням N+1. Один з генераторів не завівся, але майданчик продовжив працювати на трьох генераторах. Через 30 хвилин вийшов з ладу ще один генератор.

Дата-центр працював на джерелі 5 МВт з навантаженням 7,2 МВт. Два генератора не впоралися, і система охолодження виявилася знеструмленою. ІТ-обладнання з-за перегріву початок відключатися. Дата-центр працював ще 30 хвилин на ДБЖ (2N по 15 хвилин кожен). Загальна відключення дата-центру відбулося ще через півгодини.

На відновлення магістрального енергопостачання пішло шість годин, але дата-центр цілком повернувся до роботи лише через вісім годин.

За даними Emerson Network Power, відмова ДГУ обходиться в середньому в суму $463 890.

2. Захист від коротких замикань і збої в автоматах

Неправильно номіновані або неузгоджені автомати можуть призвести до суттєвих пошкоджень систем, тривалого простою і навіть викликати травми персоналу. Неузгоджений захист ланцюга ― це насамперед проблема проектування і здачі в експлуатацію.

Зазвичай помилки при перемиканні викликані людським фактором. За даними Emerson Network Power, вони є третіми за частотою серед причин аварій в дата-центрах (51%).

Незакріплені, нещільні з'єднання на пристроях перемикання можуть також стати причиною відходу дата-центру в оф-лайн.

3. Відмова акумуляторів ДБЖ і перевищення потужності

Дослідження Emerson Network Power на базі 450 операторів дата-центрів показало, що відмова акумуляторів ДБЖ - найчастіша причина відключення енергії (з цим зіткнулися 55% опитаних).

ДБЖ забезпечують безперервну і регульовану подачу чистої енергії на ІТ-обладнання: за допомогою акумуляторів закривається проміжок між припиненням подачі магістральної енергії та початком подачі енергії від генераторів.

Перевищення потужності ДБЖ - друга за частотою причина збоїв в роботі дата-центрів: за результатами дослідження Emerson Network Power, з-за цієї проблеми, як зазначили респонденти, відбувається 53% аварій.

У міру зростання вимог до ІТ інфраструктура дата-центрів та їх сервіси повинні також удосконалюватися, щоб не перевантажувати існуючі системи.

За даними Emerson Network Power, середня сума, в яку обходяться відмови ДБЖ в дата-центрах - $687 700.

4. Виток води

Вода і ІТ залишаються несумісними речами, але при цьому саме вода стає причиною чималої частки відхіда дата-центрів в оф-лайн. Дослідження Emerson Network Power наводить цифру в 35% - саме стільки опитаних назвали виток води як причину відключень.

Виток води і підвищення вологості можуть бути викликані різними причинами: погодними умовами, прохудившимися трубами, протіканнями кондиціонерів і так далі. Такого роду події можна запобігти, якщо забезпечити герметизацію критичних частин ІТ-систем і встановити системи моніторингу, що дозволяють виявити виток води.

Опади, підтоплення або протікання кондиціонера обходяться дата-центрам в середньому в $489 100.

5. Неналежна експлуатація

Неправильна експлуатація дата-центру (на прикладі помилок в експлуатації таких простих речей, як акумуляторні батареї або система ДБЖ) може мати серйозні наслідки. Збільшити час безперебійної роботи допоможе програмований логічний контролер (PLC), що використовується в різних промислових додатках для моніторингу та/або для забезпечення безпеки.

У серпні 2009 року дата-центр Internap Network Services (INAP) в Бостоні пішов в оф-лайн через неналежне обслуговування акумуляторних батарей. Internap заявила, що відмова сталася із-за припинення подання струму енергопостачальною організацією, що спричинило за собою нездатність дата-центру перейти на резервне живлення від акумуляторів.

6. Помилки проектування

За інформацією від Schneider Electric, роками в галузі ЦОД приймалося як належне те, що причиною відмови №1 є помилка оператора в процесі експлуатації, а не поганий проект або інжиніринг майданчика.

Перша велика помилка ЦОДів - те, що команду експлуатаційників не притягують до процесу проектування. Друга помилка полягає в тому, що вони занадто сліпо покладаються на проект дата-центру. SE вважає, що проектувальники повинні повністю підготувати людей, які будуть займатися експлуатацією дата-центру з першого дня його роботи. В цьому питанні людський фактор виходить на перший план.

Інші помилки полягають у нездатності правильно підібрати фахівців; системно навчити людей і тестувати їх рівень підготовки; організувати документування процесів і процедур в доповненні до операційних програм.

Сюди ж можна додати і нездатність: виконати відповідні процедури і процеси в проектованому просторі; розробити та впровадити системи перевірки якості; використовувати інструменти програм управління ― такі як системи контролю, які допомагають відслідковувати роботу пристроїв через інтелектуальні вимірювальні пристрої на постійній основі.

7. Природні катаклізми

Стихійні лиха трапляються незалежно від людини. «Це дія вищих сил», - каже Ансетт.

Найбільші оператори ЦОД, як правило, будуються в районах, де такі лиха, як урагани, землетруси і повені, трапляються вкрай рідко або взагалі ніколи. Проте все ж безліч дата-центрів будуються в небезпечних зонах.

Наприклад, ураган «Сэнди» у 2012 році був настільки потужним, що кілька великих хабів в Нью-Йорку вийшли з ладу. Ті, які не залило водою, постраждали від відключення енергії.

Коли ураган прийшов в регіон, місцева енергопостачальна компанія Consolidated Edison була змушена відключити енергосистеми в нижньому Манхеттені, щоб уникнути ескалації небезпеки для дата-центрів. Постраждали тисячі клієнтів.

Компанія Emerson Network Power підрахувала, що в середньому оператори витрачають на післяаварійне відновлення дата-центрів, які постраждали внаслідок стихійного лиха, $395 065.

Яка ж ціна відмови?

Відмови дата-центрів, якщо не брати до уваги їх потенційну загрозу життю і здоров'ю людей, є для операторів великими статтями витрат. Компанія Emerson Network Power підрахувала, що в 2013 році відмови дата-центрів коштували в перерахунку на хвилину роботи на 41% більше, ніж у 2010-му: $7900 і $5600 відповідно. Найбільш висока цифра для організації становила $1,7 млн.

 

Правила використання матеріалів сайту

Страницы: 1 2 3 4 5 6 7 8 9 10