Съвременните ИТ платформи са проектирани да обслужват повече потребители от всякога, но какво се случва, когато тези системи станат основна точка за достъп за повечето, ако не и за всички потребители? Какво се случва, когато критична система претърпи неизправност или изпадне напълно?

стратегия

Проучване на Съвета за подготовка за възстановяване при бедствия установи преди две години, че само 27 процента от компаниите са получили преминаваща оценка за готовност за бедствия. Колкото повече разчитаме на центрове за данни, толкова по-скъпи стават прекъсванията на центровете за данни. Неотдавнашно проучване на Ponemon Institute и Emerson Network Power установи, че:

  • Цената на престоя се е увеличила с 38 процента от 2010 г. насам.
  • Разходите за престой за повечето предприятия, зависими от центъра за данни, се увеличават по-бързо от средното.
  • Максималните разходи за престой са се увеличили с 32% от 2013 г. и 81% от 2010 г.
  • Максималните разходи за престой за 2016 г. са 2 409 991 долара.
  • Неизправността на UPS системата продължава да бъде причина номер едно за непланирани прекъсвания на центъра за данни, което представлява една четвърт от всички подобни събития.
  • Киберпрестъпността представлява най-бързо нарастващата причина за прекъсвания на центрове за данни, нараствайки от 2% от прекъсванията през 2010 г. на 18% през 2013 г. до 22% в последното проучване.

Имайки предвид това, каква е вашата стратегия за DR? Готови ли сте за спешен случай?

Оразмеряване и планиране на DR

Тъй като всяка среда е уникална, планирането на капацитет за възстановяване при бедствия може да има различни форми и форми в зависимост от целите на организацията. Следните четири показателя обаче са добра отправна точка:

ДР документация

С планирането на ДР идва важната задача на документацията. Реалността е, че тази стъпка често се забравя или се отлага до последната минута. Лошата документация може да доведе до много лош опит с DR. Администраторите трябва не само да създават текуща документация за разпределена среда, но трябва да създадат и така наречената „жива работна книга за DR“.

Обмислете следното, когато работите по план и документация за DR:

  • Тази работна книга е наистина всеобхватен документ, който ще се развива с промяната на околната среда.
  • Документът ще отразява всеки ИТ екип и техните преки отговорности в случай на събитие.
  • В този документ ще бъдат разписани и различни сценарии за различните отдели.
  • Ще има стъпки за отстраняване за всеки екип и всяко отговорно лице ще има задача, когато настъпи прекъсване или предварително определено събитие.
  • Мениджърите трябва непрекъснато да представят тази работна книга на своя персонал и да гарантират, че разбират своите роли и функции, ако се случи събитие.

И не позволявайте на тези документи да остареят. Актуализирайте ги и се уверете, че плановете за DR са на място и се поддържат свежи.

DR тестване, поддръжка и най-добри практики

Каква полза от стабилния план за DR, ако никой не знае какво да прави, когато действително се случи бедствие? Единственият начин, по който околната среда може да се използва правилно с възстановяване при бедствия, е ако всички правилни хора са в състояние да вземат добри решения въз основа на планирана директива.

Целият персонал на ИТ екипа и ключовият бизнес персонал трябва да бъдат обучени в управлението на събития в DR. Ако се случи действително бедствие, всички ключови хора, участващи в бизнеса или ИТ, трябва да знаят как да предприемат действия. Това ще включва предупреждение, незабавно отстраняване и контрол на щетите.

Единственият начин планът за DR да остане актуален е, ако се провежда непрекъснато обучение на всички нива.

Това включва бизнес слоя. Днешният бизнес силно разчита на своята ИТ инфраструктура, което означава, че заинтересованите страни в бизнеса трябва да имат мнение и елементи в действащия план за DR.

DR средите трябва да бъдат тествани и проверени, за да функционират оптимално. Тези тестове могат да се провеждат в извънработно време или чрез огледална външна среда. Има многобройни опции за тестване и най-добрата ще зависи от нуждите на ИТ екипа.

Не е нужно да дърпате щепсела на центъра за данни, за да сте сигурни, че нещата работят. Обмислете следните препоръки за тестване за валидиране на DR среди:

  • Създаване на потребители в сянка. Има мощни инструменти, които могат да помогнат за създаването на много стабилни стратегии за DR. Например LoginVSI позволява на организациите да засенчват потребителите, за да имитират въздействието върху околната среда, системата, приложението и дори бизнеса. Използването на тези видове инструменти може да ви помогне да разберете планирането на праговете, как потребителите взаимодействат с околната среда и дори да тестват вторичен сайт, без всъщност да се налага да пренасочват живите потребители.
  • Използвайте виртуализацията. Технологиите за балансиране на натоварването и системите за отказоустойчивост са изминали наистина дълъг път. Например, NetScaler на Citrix и F5 ADC имат мощни възможности за глобално балансиране на натоварването. Те могат да бъдат разположени и като виртуални уреди. Можете да тествате отказоустойчивост, като се уверите, че балансирането на натоварването работи и че потребителите безпроблемно се прехвърлят във вторична среда.
  • Използвайте интелигентна интелигентност за тестване на DR. Физическите системи могат да помогнат и при тестване на DR. Функциите с много пътеки ви позволяват да превключвате цели мрежови компоненти. Можете да гарантирате, че критичните системи продължават да остават активни, като тествате критични мрежови компоненти, без да се налага да сваляте системите си.

Не забравяйте, че стратегията за DR е изключително важна за вашия бизнес. Ако нещо се случи, ще можете да работите много бързо. Помислете само колко струва на вашия бизнес да не работи за час ... или цял ден. Тези стратегии са от решаващо значение за поддържането на бизнес подвижен и много устойчив. Не забравяйте да планирате, тествате, документирате и поддържате цялата си стратегия за DR.