بازیابی از فاجعه چیست؟
بازیابی از فاجعه فرآیندی است که طی آن یک سازمان برای پیشبینی و مقابله با فجایع مرتبط با فناوری آماده میشود. این فرآیند شامل آمادهسازی و بهبود از هر رویدادی است که مانع از انجام وظایف یا اهداف تجاری یک سیستم یا بار کاری در مکان اصلی استقرار آن میشود، مانند قطعی برق، رویدادهای طبیعی یا مسائل امنیتی. اهداف بازیابی از فاجعه با معیارهای هدف نقطه بازیابی (RPO) و هدف زمان بازیابی (RTO) سنجیده میشوند. خرابیهایی که بازیابی از فاجعه به آنها میپردازد، معمولاً نادرتر از مواردی هستند که توسط دسترسیپذیری بالا پوشش داده میشوند و شامل رویدادهای فاجعهآمیز در مقیاس بزرگتر هستند. بازیابی از فاجعه شامل رویهها و سیاستهای سازمان برای بهبود سریع از چنین رویدادهایی است.
چرا بازیابی از فاجعه مهم است؟
فاجعه یک مشکل غیرمنتظره است که منجر به کندی، وقفه یا قطعی شبکه در یک سیستم فناوری اطلاعات میشود. قطعیها به اشکال مختلفی رخ میدهند، از جمله نمونههای زیر:
- زلزله یا آتشسوزی
- خرابیهای فناوری
- ناسازگاریهای سیستمی
- خطای ساده انسانی
- دسترسی غیرمجاز عمدی توسط اشخاص ثالث
این فجایع عملیات تجاری را مختل میکنند، مشکلات خدمات مشتری ایجاد میکنند و منجر به از دست رفتن درآمد میشوند. یک طرح بازیابی از فاجعه به سازمانها کمک میکند تا بهسرعت به رویدادهای مخل پاسخ دهند و مزایای کلیدی را فراهم میکند.
تضمین تداوم کسبوکار
وقتی فاجعهای رخ میدهد، میتواند برای همه جنبههای کسبوکار زیانبار و اغلب پرهزینه باشد. همچنین عملیات تجاری عادی را مختل میکند، زیرا بهرهوری تیم به دلیل دسترسی محدود به ابزارهای مورد نیاز برای کار کاهش مییابد. یک طرح بازیابی از فاجعه امکان راهاندازی سریع سیستمهای پشتیبان و دادهها را فراهم میکند تا عملیات طبق برنامه ادامه یابد.
افزایش امنیت سیستم
ادغام حفاظت از دادهها، پشتیبانگیری و فرآیندهای بازیابی در یک طرح بازیابی از فاجعه، تأثیر تهدیداتی مانند باجافزار، بدافزار یا سایر خطرات امنیتی برای کسبوکار را محدود میکند. برای مثال، پشتیبانگیری دادهها به ابر دارای ویژگیهای امنیتی داخلی متعددی است که فعالیتهای مشکوک را قبل از تأثیرگذاری بر کسبوکار محدود میکند.
بهبود حفظ مشتری
اگر فاجعهای رخ دهد، مشتریان قابلیت اطمینان روشهای امنیتی و خدمات سازمان را زیر سؤال میبرند. هرچه تأثیر یک فاجعه بر کسبوکار طولانیتر باشد، نارضایتی مشتریان بیشتر میشود. یک طرح بازیابی از فاجعه خوب با آموزش کارکنان برای رسیدگی به پرسوجوهای مشتریان، این ریسک را کاهش میدهد. مشتریان وقتی مشاهده میکنند که کسبوکار برای مدیریت هر فاجعهای آمادگی کامل دارد، اعتماد بیشتری پیدا میکنند.
کاهش هزینههای بازیابی
بسته به شدت فاجعه، هم درآمد و هم بهرهوری از دست میرود. یک طرح بازیابی از فاجعه قوی از ضررهای غیرضروری جلوگیری میکند، زیرا سیستمها بهزودی پس از حادثه به حالت عادی بازمیگردند. برای مثال، راهحلهای ذخیرهسازی ابری یک روش مقرونبهصرفه برای پشتیبانگیری دادهها هستند. شما میتوانید دادهها را مدیریت، نظارت و نگهداری کنید در حالی که کسبوکار بهطور عادی فعالیت میکند.
بازیابی از فاجعه چگونه کار میکند؟
بازیابی از فاجعه بر راهاندازی مجدد برنامهها در عرض چند دقیقه پس از قطعی تمرکز دارد. سازمانها به سه مؤلفه زیر توجه میکنند:
پیشگیری
برای کاهش احتمال وقوع یک فاجعه مرتبط با فناوری، کسبوکارها به طرحی نیاز دارند تا اطمینان حاصل کنند که همه سیستمهای کلیدی تا حد ممکن قابلاعتماد و امن هستند. از آنجا که انسانها نمیتوانند فجایع طبیعی را کنترل کنند، پیشگیری تنها به مشکلات شبکه، خطرات امنیتی و خطاهای انسانی اعمال میشود. باید ابزارها و تکنیکهای مناسب را برای پیشگیری از فاجعه تنظیم کنید. برای مثال، نرمافزار تست سیستم که بهطور خودکار تمام فایلهای پیکربندی جدید را قبل از اعمال بررسی میکند، میتواند از اشتباهات پیکربندی و خرابیها جلوگیری کند.
پیشبینی
پیشبینی شامل پیشبینی فجایع احتمالی آینده، آگاهی از پیامدها و برنامهریزی رویههای بازیابی از فاجعه مناسب است. پیشبینی دقیق آنچه ممکن است رخ دهد دشوار است، اما میتوانید با دانش از موقعیتهای قبلی و تحلیل، راهحل بازیابی از فاجعهای ایجاد کنید. برای مثال، پشتیبانگیری تمام دادههای تجاری حیاتی به ابر در پیشبینی خرابی سختافزاری دستگاههای داخلی، رویکردی عملی برای مدیریت دادهها است.
کاهش تأثیر
کاهش تأثیر نحوه پاسخ یک کسبوکار پس از یک سناریوی فاجعه است. استراتژی کاهش تأثیر به کاهش اثرات منفی بر رویههای تجاری عادی هدف دارد. همه ذینفعان کلیدی میدانند در صورت وقوع فاجعه چه باید بکنند، از جمله مراحل زیر:
- بهروزرسانی مستندات
- انجام آزمایشهای منظم بازیابی از فاجعه
- شناسایی رویههای عملیاتی دستی در صورت قطعی
- هماهنگی استراتژی بازیابی از فاجعه با پرسنل مربوطه
عناصر کلیدی یک طرح بازیابی از فاجعه چیست؟
یک طرح بازیابی از فاجعه مؤثر شامل عناصر کلیدی زیر است:
ارتباطات داخلی و خارجی
تیمی که مسئول ایجاد، اجرا و مدیریت طرح بازیابی از فاجعه است، باید درباره نقشها و مسئولیتهای خود با یکدیگر ارتباط برقرار کنند. اگر فاجعهای رخ دهد، تیم باید بداند چه کسی مسئول چیست و چگونه با کارکنان، مشتریان و یکدیگر ارتباط برقرار کند.
جدول زمانی بازیابی
تیم بازیابی از فاجعه باید درباره اهداف و چارچوبهای زمانی برای بازگشت سیستمها به عملیات عادی پس از فاجعه تصمیمگیری کند. جدول زمانی برخی صنایع ممکن است طولانیتر از دیگران باشد، در حالی که برخی دیگر باید در عرض چند دقیقه به حالت عادی بازگردند. جدول زمانی باید به دو هدف زیر بپردازد:
- هدف زمان بازیابی (RTO): هدف زمان بازیابی (RTO) معیاری است که حداکثر مدت زمانی را که قبل از تکمیل بازیابی از فاجعه میگذرد، تعیین میکند. RTOهای شما ممکن است بسته به زیرساخت فناوری اطلاعات و سیستمهای تحت تأثیر متفاوت باشد.
- هدف نقطه بازیابی (RPO) هدف نقطه بازیابی (RPO) حداکثر مدت زمان قابلقبول برای از دست دادن دادهها پس از یک فاجعه است. برای مثال، اگر RPO شما دقیقهها یا ساعتها باشد، باید دادههای خود را بهطور مداوم به سایتهای آینهای پشتیبانگیری کنید، نه فقط یکبار در پایان روز.
پشتیبانگیری دادهها
طرح بازیابی از فاجعه تعیین میکند که چگونه دادههای خود را پشتیبانگیری کنید. گزینهها شامل ذخیرهسازی ابری، پشتیبانگیری پشتیبانیشده توسط فروشنده و پشتیبانگیری دادههای داخلی خارج از سایت است. برای در نظر گرفتن رویدادهای فاجعه طبیعی، پشتیبانها نباید در محل باشند. تیم باید تعیین کند که چه کسی دادهها را پشتیبانگیری خواهد کرد، چه اطلاعاتی پشتیبانگیری میشود و چگونه سیستم را پیادهسازی کند.
آزمایش و بهینهسازی
باید طرح بازیابی از فاجعه خود را حداقل یک یا دو بار در سال آزمایش کنید. میتوانید هر شکافی که در این آزمایشها شناسایی میکنید را مستند کرده و برطرف کنید. به همین ترتیب، باید استراتژیهای امنیتی و حفاظت از دادهها را مرتباً بهروزرسانی کنید تا از دسترسی غیرمجاز غیرعمدی جلوگیری شود.
چگونه میتوانید یک تیم بازیابی از فاجعه ایجاد کنید؟
تیم بازیابی از فاجعه شامل تیمی مشارکتی از متخصصان، مانند کارشناسان فناوری اطلاعات و افرادی در نقشهای رهبری است که برای تیم حیاتی خواهند بود. باید شخصی در تیم باشد که مسئولیت حوزههای کلیدی زیر را بر عهده گیرد:
مدیریت بحران
فرد مسئول مدیریت بحران، طرح بازیابی از فاجعه را بلافاصله پیادهسازی میکند. آنها با سایر اعضای تیم و مشتریان ارتباط برقرار میکنند و فرآیند بازیابی از فاجعه را هماهنگ میکنند.
تداوم کسبوکار
مدیر تداوم کسبوکار اطمینان میدهد که طرح بازیابی از فاجعه با نتایج تحلیل تأثیر کسبوکار همراستا است. آنها برنامهریزی تداوم کسبوکار را در استراتژی بازیابی از فاجعه شامل میکنند.
ارزیابی و بازیابی تأثیر
مدیران ارزیابی تأثیر، متخصصان زیرساخت فناوری اطلاعات و برنامههای تجاری هستند. آنها زیرساخت شبکه، سرورها و پایگاههای داده را ارزیابی و تعمیر میکنند. همچنین وظایف دیگر بازیابی از فاجعه مانند موارد زیر را مدیریت میکنند:
- ادغام برنامهها
- حفظ سازگاری دادهها
- تنظیمات و پیکربندی برنامهها
بهترین روشهای بازیابی از فاجعه چیست؟
هنگام برنامهریزی بازیابی از فاجعه، کسبوکارها یک یا چند روش زیر را پیادهسازی میکنند:
پشتیبانگیری
پشتیبانگیری دادهها یکی از سادهترین روشهای بازیابی از فاجعه است که همه کسبوکارها آن را پیادهسازی میکنند. پشتیبانگیری دادههای مهم شامل ذخیرهسازی دادهها خارج از سایت، در ابر یا روی یک درایو قابلحذف است. باید دادهها را مرتباً پشتیبانگیری کنید تا بهروز بمانند. برای مثال، با پشتیبانگیری به AWS، کسبوکارها زیرساختی انعطافپذیر و مقیاسپذیر دریافت میکنند که از همه انواع دادهها محافظت میکند.
بازیابی از فاجعه مرکز داده
در صورت بروز برخی انواع فجایع طبیعی، تجهیزات مناسب میتوانند از مرکز داده شما محافظت کرده و به بازیابی سریع از فاجعه کمک کنند. برای مثال، ابزارهای مهار آتش به تجهیزات و دادهها کمک میکنند تا از آتشسوزی جان سالم به در ببرند، و منابع قدرت پشتیبان از تداوم کسبوکارها در صورت قطعی برق پشتیبانی میکنند. به همین ترتیب، مراکز داده AWS دارای سیستمهای نوآورانهای هستند که آنها را از خطرات انسانی و طبیعی محافظت میکند.
مجازیسازی
کسبوکارها دادهها و عملیات خود را با استفاده از ماشینهای مجازی (VM) خارج از سایت که از فجایع فیزیکی تأثیر نمیپذیرند، پشتیبانگیری میکنند. با مجازیسازی بهعنوان بخشی از طرح بازیابی از فاجعه، کسبوکارها برخی فرآیندها را خودکار میکنند و سریعتر از یک فاجعه طبیعی بهبود مییابند. انتقال مداوم دادهها و بارهای کاری به VMهایی مانند Amazon Elastic Compute Cloud (Amazon EC2) برای مجازیسازی مؤثر ضروری است.
بازیابی از فاجعه بهعنوان سرویس
خدمات بازیابی از فاجعه مانند AWS Elastic Disaster Recovery میتوانند پردازش کامپیوتری و عملیات تجاری حیاتی یک شرکت را در صورت فاجعه به خدمات ابری خود منتقل کنند. بنابراین، عملیات عادی میتوانند از مکان ارائهدهنده ادامه یابند، حتی اگر سرورهای داخلی از کار افتاده باشند. Elastic Disaster Recovery همچنین از قطعی مناطق در ابر محافظت میکند.
سایت سرد
در صورت بروز فاجعه طبیعی، یک شرکت عملیات خود را به یک مکان فیزیکی دیگر که بهندرت استفاده میشود، به نام سایت سرد منتقل میکند. به این ترتیب، کارکنان مکانی برای کار دارند و عملکردهای تجاری میتوانند بهصورت عادی ادامه یابند. این نوع بازیابی از فاجعه از دادههای مهم محافظت یا بازیابی نمیکند، بنابراین باید روش بازیابی از فاجعه دیگری در کنار این روش استفاده شود.