الفشل المحتمل للشبكات الأكثر تحملًا للأعطال (High Availability and Disaster Recovery):
حتى الشبكات الأكثر تحملًا للأعطال قد تفشل، وهذا أمر مؤسف. عندما تفشل استراتيجيات تحمل الأعطال المكلفة والمُنفذة بعناية، تكون أمامك عمليات التعافي من الكوارث.
يمكن أن يأخذ التعافي من الكوارث أشكالًا عديدة، وبالإضافة إلى الكوارث مثل الحريق والفيضانات والسرقة، يمكن للعديد من الانقطاعات المحتملة للأعمال أن تقع تحت عنوان التعافي من الكوارث، على سبيل المثال، قد يؤدي فشل إمداد الكهرباء في منطقتك إلى تعطيل الوظائف التجارية، ومثل هذا الحدث، على الرغم من أنه ليس كارثة بحد ذاته، قد يستدعي استخدام طرق التعافي من الكوارث.
الركيزة الأساسية لكل استراتيجية للتعافي من الكوارث هي الحفاظ على البيانات واستعادتها، وعندما نتحدث عن الحفظ والاستعادة، يجب أن نتحدث عن النسخ الاحتياطية، وتنفيذ جدول نسخ احتياطي منتظم يمكن أن ينقذك من الكثير من المتاعب عندما تفشل تحمل الأعطال أو عندما تحتاج إلى استعادة ملف تم حذفه عن طريق الخطأ، وعندما يحين وقت تصميم جدول نسخ احتياطي، يمكنك استخدام ثلاثة أنواع رئيسية من النسخ الاحتياطية: Full، Differential، وIncremental.
النسخ الاحتياطية (Buckups):
النسخ الاحتياطية تعادل بوليصة تأمين للخادم، أو محطة العمل، أو أي جهاز يحتوي على بيانات، معظم الوقت، تكون مجرد كيانات تستهلك الوقت/الموارد تجعلك تتساءل لماذا تضيع وقتك في القيام بها، ومع ذلك، عندما تحدث الكارثة، تدرك فورًا قيمتها وتندم على عدم القيام بها بتكرار أكبر.
النسخ الاحتياطي الكامل (Full Buckups):
الطريقة المفضلة للنسخ الاحتياطي هي طريقة النسخ الاحتياطي الكامل، التي تنسخ جميع الملفات والمجلدات من القرص الصلب إلى وسائط النسخ الاحتياطي، وهناك بعض الأسباب التي تجعل القيام بنسخ احتياطي كامل ليس دائمًا ممكنًا، أولها على الأرجح هو الوقت المستغرق في أداء النسخ الاحتياطي الكامل.
نصيحة أختبار:
حتى الشبكات الأكثر تحملًا للأعطال قد تفشل، وهذا أمر مؤسف. عندما تفشل استراتيجيات تحمل الأعطال المكلفة والمُنفذة بعناية، تكون أمامك عمليات التعافي من الكوارث.
يمكن أن يأخذ التعافي من الكوارث أشكالًا عديدة، وبالإضافة إلى الكوارث مثل الحريق والفيضانات والسرقة، يمكن للعديد من الانقطاعات المحتملة للأعمال أن تقع تحت عنوان التعافي من الكوارث، على سبيل المثال، قد يؤدي فشل إمداد الكهرباء في منطقتك إلى تعطيل الوظائف التجارية، ومثل هذا الحدث، على الرغم من أنه ليس كارثة بحد ذاته، قد يستدعي استخدام طرق التعافي من الكوارث.
الركيزة الأساسية لكل استراتيجية للتعافي من الكوارث هي الحفاظ على البيانات واستعادتها، وعندما نتحدث عن الحفظ والاستعادة، يجب أن نتحدث عن النسخ الاحتياطية، وتنفيذ جدول نسخ احتياطي منتظم يمكن أن ينقذك من الكثير من المتاعب عندما تفشل تحمل الأعطال أو عندما تحتاج إلى استعادة ملف تم حذفه عن طريق الخطأ، وعندما يحين وقت تصميم جدول نسخ احتياطي، يمكنك استخدام ثلاثة أنواع رئيسية من النسخ الاحتياطية: Full، Differential، وIncremental.
النسخ الاحتياطية (Buckups):
النسخ الاحتياطية تعادل بوليصة تأمين للخادم، أو محطة العمل، أو أي جهاز يحتوي على بيانات، معظم الوقت، تكون مجرد كيانات تستهلك الوقت/الموارد تجعلك تتساءل لماذا تضيع وقتك في القيام بها، ومع ذلك، عندما تحدث الكارثة، تدرك فورًا قيمتها وتندم على عدم القيام بها بتكرار أكبر.
النسخ الاحتياطي الكامل (Full Buckups):
الطريقة المفضلة للنسخ الاحتياطي هي طريقة النسخ الاحتياطي الكامل، التي تنسخ جميع الملفات والمجلدات من القرص الصلب إلى وسائط النسخ الاحتياطي، وهناك بعض الأسباب التي تجعل القيام بنسخ احتياطي كامل ليس دائمًا ممكنًا، أولها على الأرجح هو الوقت المستغرق في أداء النسخ الاحتياطي الكامل.
نصيحة أختبار:
أثناء عملية الاستعادة، النسخ الاحتياطي الكامل (Full Buckups) هو أسرع طريقة لاستعادة البيانات من بين جميع الطرق التي نوقشت هنا، لأن مجموعة واحدة فقط من الوسائط مطلوبة لاستعادة كاملة.
اعتمادًا على كمية البيانات التي يجب نسخها احتياطيًا، يمكن أن تستغرق النسخ الاحتياطية الكاملة وقتًا طويلًا جدًا عند إجراء النسخ الاحتياطي ويمكن أن تستخدم موارد نظام كبيرة، اعتمادًا على تكوين أجهزة النسخ الاحتياطي، يمكن أن يؤدي إكمال هذا النسخ الاحتياطي إلى إبطاء الشبكة بشكل كبير، بالإضافة إلى ذلك، تحتوي بعض البيئات على بيانات أكثر مما يمكن أن يتسع له وسيط واحد. لذلك، ويصبح القيام بنسخ احتياطي كامل أمرًا معقدًا لأن شخصًا ما قد يحتاج إلى أن يكون موجودًا لتغيير الوسائط.
الميزة الرئيسية للنسخ الاحتياطي الكامل هي أن مجموعة واحدة من الوسائط تحتوي على جميع البيانات التي تحتاجها لاستعادة النظام. إذا حدث فشل، فإن هذه المجموعة الواحدة من الوسائط ينبغي أن تكون كل ما تحتاجه لاستعادة جميع البيانات ومعلومات النظام، النتيجة النهائية هي أن أي تعطيل للشبكة يتم تقليله بشكل كبير.
لسوء الحظ، يمكن أن تكون قوتها أيضًا نقطة ضعفها، وجود مجموعة واحدة من الوسائط التي تحتوي على بيانات المنظمة يمكن أن يكون مخاطرة أمنية، وإذا وقعت الوسائط في الأيدي الخطأ، يمكن استعادة جميع البيانات على جهاز كمبيوتر آخر، واستخدام كلمات المرور على النسخ الاحتياطية واستخدام موقع آمن بعيد وموقع آمن في الموقع يمكن أن يقلل من خطر الأمان.
لنسخ الاحتياطي التفاضلي (Differential Backups):
الشركات التي ليس لديها وقت كافٍ لإكمال النسخ الاحتياطي الكامل يوميًا يمكن أن تستخدم النسخ الاحتياطي التفاضلي، والنسخ الاحتياطية التفاضلية أسرع من النسخ الاحتياطي الكامل لأنها تنسخ فقط البيانات التي تغيرت منذ آخر نسخ احتياطي كامل. وهذا يعني أنه إذا قمت بعمل نسخ احتياطي كامل يوم السبت ونسخ احتياطي تفاضلي يوم الأربعاء التالي، يتم نسخ البيانات التي تغيرت منذ السبت فقط، لاستعادة النسخ الاحتياطي التفاضلي، تحتاج إلى آخر نسخ احتياطي كامل وأحدث نسخ احتياطي تفاضلي.
تعرف النسخ الاحتياطية التفاضلية الملفات التي تغيرت منذ آخر نسخ احتياطي كامل لأنها تستخدم إعدادًا يسمى بت الأرشيف، بت الأرشيف يُعلِّم الملفات التي تغيرت أو تم إنشاؤها ويحددها كملفات تحتاج إلى النسخ الاحتياطي، والنسخ الاحتياطية الكاملة لا تهتم ببت الأرشيف لأن جميع الملفات يتم نسخها احتياطيًا بغض النظر عن التاريخ. ومع ذلك، تقوم النسخ الاحتياطية الكاملة بمسح بت الأرشيف بعد نسخ البيانات احتياطيًا لتجنب الارتباك في المستقبل، والنسخ الاحتياطية التفاضلية تلاحظ بت الأرشيف وتستخدمه لتحديد الملفات التي تغيرت. النسخ الاحتياطية التفاضلية لا تعيد تعيين معلومات بت الأرشيف.
النسخ الاحتياطي التزايدي (Incremental Backups):
بعض الشركات لديها وقت محدود يمكن تخصيصه لإجراءات النسخ الاحتياطي، ومثل هذه المنظمات من المحتمل أن تستخدم النسخ الاحتياطي التزايدي في استراتيجيتها للنسخ الاحتياطي، والنسخ الاحتياطية التزايدية تحفظ فقط الملفات التي تغيرت منذ آخر نسخ احتياطي كامل أو تزايدي، ومثل النسخ الاحتياطية التفاضلية، تستخدم النسخ الاحتياطية التزايدية بت الأرشيف لتحديد الملفات التي تغيرت منذ آخر نسخ احتياطي كامل أو تزايدي، على عكس التفاضليات، تقوم النسخ الاحتياطية التزايدية بمسح بت الأرشيف، لذلك الملفات التي لم تتغير لا يتم نسخها احتياطيًا.
نصيحة أختبار:
كل من النسخ الاحتياطي الكامل والتزايدي يقوم بمسح بت الأرشيف بعد نسخ الملفات احتياطيًا.
يأتي وقت النسخ الاحتياطي الأسرع للنسخ الاحتياطية التزايدية بثمن وهو الوقت المطلوب للاستعادة. استعادة من فشل باستخدام النسخ الاحتياطي التزايدي يتطلب العديد من مجموعات الوسائط - جميع مجموعات وسائط النسخ الاحتياطي التزايدية والمجموعة الواحدة لأحدث نسخ احتياطي كامل. على سبيل المثال، إذا كان لديك نسخ احتياطي كامل من يوم الأحد ونسخ احتياطي تزايدي ليوم الاثنين، الثلاثاء، والأربعاء، تحتاج إلى أربع مجموعات من الوسائط لاستعادة البيانات. كل مجموعة في التدوير هي خطوة إضافية في عملية الاستعادة ونقطة فشل إضافية. مجموعة وسائط تزايدية تالفة تعني أنك لا تستطيع استعادة البيانات.
ملخص استراتيجيات النسخ الاحتياطي المختلفة موضح في الجدول التالي:
ملخص استراتيجيات النسخ الاحتياطي المختلفة موضح في الجدول التالي:
يقوم بعمل نسخة احتياطية لجميع البيانات على مجموعة وسائط واحدة، واستعادة البيانات تتطلب أقل عدد من مجموعات الوسائط.
الـ SnapShot:
بالإضافة إلى الأنواع الثلاثة السابقة من النسخ الاحتياطي، هناك أيضًا الـSnapshots. في حين أن النسخ الاحتياطي يمكن أن يستغرق وقتًا طويلاً لإكماله، فإن ميزة الـSnapshot، وهي صورة لحالة النظام في لحظة معينة، هي أنها نسخة فورية من النظام، ويتم ذلك غالبًا عن طريق تقسيم مجموعة الأقراص المتطابقة أو عن طريق إنشاء نسخة من كتلة القرص عند كتابتها للحفاظ على الأصل وجعله متاحًا.
الـ Snapshots شائعة في تنفيذات الأجهزة الافتراضية. يمكنك أخذ أي عدد من الـSnapshots (بشرط توفر مساحة تخزين كافية) للتمكن من إعادة النظام إلى حالة "محفوظة". تحتوي الـSnapshots على نسخة من إعدادات الجهاز الافتراضي (تكوين الأجهزة)، ومعلومات عن جميع الأقراص الافتراضية المرفقة، وحالة الذاكرة للجهاز في وقت الـSnapshot، وهذا يجعل الـSnapshots مفيدة أيضًا لاستنساخ الأجهزة الافتراضية، مما يتيح نسخ الجهاز مرة واحدة أو عدة مرات للاختبار.
نصيحة الأختبار:
فكر في الـSnapshot كصورة فوتوغرافية، وهو الاسم الذي أُخذ منه، للحظة معينة في أي نظام.
أفضل ممارسات النسخ الاحتياطي ( Backup Best Practices):
تتضمن استراتيجية النسخ الاحتياطي الناجحة العديد من التفاصيل. فيما يلي بعض الأمور التي يجب مراعاتها كجزء من خطة النسخ الاحتياطي:
التخزين خارج الموقع: فكر في تخزين مجموعات الوسائط الاحتياطية خارج الموقع حتى إذا حدثت كارثة في المبنى، تكون مجموعة الوسائط الحالية متاحة خارج الموقع، ويجب أن تكون الوسائط خارج الموقع محدثة كما هي داخل الموقع ويجب أن تكون آمنة.
تسمية الوسائط: الهدف هو استعادة البيانات بأسرع وقت ممكن، وقد يكون العثور على الوسائط التي تحتاجها صعبًا إذا لم تكن مؤشرة، وعلاوة على ذلك، يمكن أن تمنعك التسمية من تسجيل شيء تحتاج إلى الاحتفاظ به.
التحقق من النسخ الاحتياطية: لا تفترض أبدًا أن النسخ الاحتياطي كان ناجحًا. يعرف المديرون المخضرمون أن فحص سجلات النسخ الاحتياطي وإجراء اختبارات استعادة دورية جزء من عملية النسخ الاحتياطي.
التنظيف: تحتاج إلى تنظيف وحدة النسخ الاحتياطي من حين لآخر، وإذا اتسخت من الداخل، يمكن أن تفشل النسخ الاحتياطية.
نصيحة الأختبار:
يجب أن تتضمن استراتيجية النسخ الاحتياطي التخزين خارج الموقع لمواجهة السرقة، أو الحريق، أو الفيضانات، أو الكوارث الأخرى.
استخدام وحدات UPS (Uninterruptible Power Supplies)
لا يمكن أن تكون مناقشة التكرار (fault tolerance) كاملة دون النظر في القضايا المتعلقة بالطاقة والآليات المستخدمة لمواجهتها. عند تصميم نظام متحمل للأخطاء، يجب أن تتضمن التخطيط لوحدات UPS. تقوم وحدة UPS بالعديد من الوظائف وهي جزء رئيسي من اعتبار وتنفيذ السيرفرات.
على مستوى أساسي، وحدة UPS، المعروفة أيضًا باسم البطارية الاحتياطية، هي صندوق يحتوي على بطارية ودائرة شحن مدمجة، وفي أوقات الطاقة الجيدة، يتم إعادة شحن البطارية؛ وعند الحاجة إلى وحدة UPS، تكون جاهزة لتزويد السيرفر بالطاقة، وغالبًا، تتطلب وحدة UPS تزويد الطاقة بما يكفي لمنح المدير الوقت لإيقاف السيرفر بشكل منتظم، مما يمنع أي فقدان محتمل للبيانات من إيقاف التشغيل العشوائي.
لماذا تستخدم UPS؟
توفر البيانات: الهدف من أي إجراء لتحمل الأخطاء هو توفر البيانات. تضمن وحدة UPS الوصول إلى السيرفر إذا حدث انقطاع في الطاقة - على الأقل طالما يكفي لحفظ الملف.
الحماية من فقدان البيانات: يمكن أن تتسبب تقلبات الطاقة أو الانقطاع المفاجئ للطاقة في تلف البيانات على نظام السيرفر. بالإضافة إلى ذلك، تستفيد العديد من السيرفرات بشكل كامل من التخزين المؤقت، ويمكن أن يتسبب فقدان الطاقة المفاجئ في فقدان جميع المعلومات المخزنة في الذاكرة المؤقتة.
الحماية من تلف الأجهزة: يمكن أن تتسبب تقلبات الطاقة المستمرة أو الانقطاع المفاجئ في تلف المكونات المادية داخل الكمبيوتر. يمكن أن يؤدي تلف الأجهزة إلى تقليل توفر البيانات أثناء إصلاح الأجهزة.
تهديدات الطاقة (Power Threats):
بالإضافة إلى الحفاظ على السيرفر قيد التشغيل لفترة كافية لإيقافه بأمان، تحمي وحدة UPS السيرفر من الطاقة غير المستقرة ، ويمكن أن تتخذ هذه الطاقة غير المستقرة العديد من الأشكال. تحمي وحدة UPS النظام من التهديدات المتعلقة بالطاقة التالية:
- انقطاع كامل للطاقة: فشل كامل للطاقة المزودة للسيرفر.
- زيادة قصيرة في الجهد الكهربائي: زيادة قصيرة (عادة أقل من ثانية) ولكنها مكثفة في الجهد. يمكن أن تسبب هذه الزيادات ضررًا لا يمكن إصلاحه لأي نوع من المعدات، خاصة أجهزة الكمبيوتر.
- هبوط في الجهد الكهربائي: انخفاض قصير في الجهد (عكس الزيادة القصيرة). يمكن أن يتسبب هذا النوع من الانخفاض في إعادة تشغيل السيرفر.
- هبوط طويل في الجهد الكهربائي: انخفاض في الجهد يستمر عادةً لأكثر من بضع دقائق.
يمكن أن تحدث العديد من هذه التهديدات المتعلقة بالطاقة دون علمك؛ إذا لم تكن لديك وحدة UPS، فلن تتمكن من الاستعداد لها، وبالنسبة للتكلفة، ويستحق الأمر شراء وحدة UPS، إن لم يكن لأي سبب آخر سوى النوم بشكل أفضل ليلاً.
يقوم بعمل نسخة احتياطية لجميع البيانات على مجموعة وسائط واحدة. استعادة البيانات تتطلب أقل عدد من مجموعات الوسائط.
ما بعد الـ UPS ؟.
إدارة الطاقة لا تقتصر فقط على استخدام الـ UPS، وبالإضافة إلى هذه الأجهزة، يجب استخدام مولدات الطاقة لضمان استمرار تشغيل الأنظمة عند انقطاع الكهرباء لفترة طويلة. يجب أيضًا استخدام الدوائر الزائدة ومزودات الطاقة المزدوجة للأجهزة الأساسية.
أي جهاز مجهز بمخرجات متعددة مصمم خصيصًا لتوزيع الطاقة الكهربائية يُعرف بوحدة توزيع الطاقة (PDU)، وهي وفيرة في مراكز البيانات لتوفير الطاقة للحواسيب. النوعان الرئيسيان من وحدات توزيع الطاقة هما "Basic" و "Intelligent"، والأخيرة هي أي وحدة متصلة بالشبكة (مما يسمح بإدارة الطاقة عن بعد، وقياس الطاقة، وتبديل مأخذ التيار تشغيل/إيقاف، وما إلى ذلك).
تريد التأكد من أن الطاقة يمكن أن تستمر في العمل في حالة حدوث أزمة، لذا هناك مجالان آخران يجب الاهتمام بهما هما التدفئة والتهوية وتكييف الهواء (HVAC) ونظام إطفاء الحرائق. لن يكون من الجيد الاحتفاظ بتشغيل أجهزة الكمبيوتر والخوادم إذا لم تتمكن من الحفاظ على درجة الحرارة ضمن نطاق التشغيل وتوفير الأمان في حالة حدوث حريق. يجب اعتبار الأنظمة الزائدة لكلا هذين المجالين المهمين وصيانتهما بانتظام.
مواقع التعافي البارد والدافئ والساخن والسحابية (Cold, Warm, Hot, and Cloud Sites):
قد تتضمن خطة التعافي من الكوارث توفير موقع تعافي يمكن تشغيله بسرعة، وتنقسم هذه المواقع إلى ثلاث فئات: ساخنة، ودافئة، وباردة. تعتمد الحاجة إلى كل نوع من هذه المواقع إلى حد كبير على العمل الذي تقوم به والأموال المتاحة، وتمثل مواقع التعافي من الكوارث أقصى درجات الحيطة للمنظمات التي تحتاج إليها. نتيجة لذلك، فهي ليست رخيصة.
المفهوم الأساسي لموقع التعافي من الكوارث هو أنه يمكن أن يوفر قاعدة يمكن من خلالها تشغيل الشركة أثناء الكارثة. لا يقصد بموقع التعافي من الكوارث أن يوفر مكتبًا لكل موظف، ويقصد به أكثر كوسيلة للسماح للأفراد الرئيسيين بمواصلة وظائف العمل الأساسية.
بشكل عام، موقع التعافي البارد هو الذي يمكن أن يكون جاهزًا للعمل في فترة قصيرة نسبيًا، مثل يوم أو يومين. يتم الاعتناء بتوفير الخدمات مثل خطوط الهاتف والطاقة، وقد تكون الأثاث المكتبية الأساسية في مكانها، ولكن من غير المرجح أن يكون هناك أي معدات حاسوب، حتى لو كان المبنى يحتوي على بنية تحتية للشبكة وغرفة جاهزة للعمل كغرفة خوادم. في معظم الحالات، توفر المواقع الباردة الموقع الفعلي والخدمات الأساسية.
تكون المواقع الباردة مفيدة إذا كان لديك بعض التحذير من مشكلة محتملة. بشكل عام، تستخدم المنظمات المواقع الباردة التي يمكنها تحمل العطل ليوم أو يومين قبل أن تعود للعمل، إذا كنت المكتب الإقليمي لشركة كبيرة، فقد يكون من الممكن لأحد الفروع الأخرى الاهتمام بالعمل حتى تكون جاهزًا، ولكن إذا كنت المكتب الوحيد في الشركة، فقد تحتاج إلى شيء أكثر حرارة.
للمنظمات التي لديها الأموال والرغبة، تمثل مواقع التعافي الساخنة أقصى درجات استراتيجيات تحمل الأخطاء. مثل مواقع التعافي الباردة، تم تصميم المواقع الساخنة لتوفير فقط المرافق الكافية لمواصلة الوظائف الأساسية للأعمال، ولكن تم تجهيز مواقع التعافي الساخنة لتكون جاهزة للعمل في أي لحظة.
نصيحة أختبار:
أي جهاز مجهز بمخرجات متعددة مصمم خصيصًا لتوزيع الطاقة الكهربائية يُعرف بوحدة توزيع الطاقة (PDU)، وهي وفيرة في مراكز البيانات لتوفير الطاقة للحواسيب. النوعان الرئيسيان من وحدات توزيع الطاقة هما "Basic" و "Intelligent"، والأخيرة هي أي وحدة متصلة بالشبكة (مما يسمح بإدارة الطاقة عن بعد، وقياس الطاقة، وتبديل مأخذ التيار تشغيل/إيقاف، وما إلى ذلك).
تريد التأكد من أن الطاقة يمكن أن تستمر في العمل في حالة حدوث أزمة، لذا هناك مجالان آخران يجب الاهتمام بهما هما التدفئة والتهوية وتكييف الهواء (HVAC) ونظام إطفاء الحرائق. لن يكون من الجيد الاحتفاظ بتشغيل أجهزة الكمبيوتر والخوادم إذا لم تتمكن من الحفاظ على درجة الحرارة ضمن نطاق التشغيل وتوفير الأمان في حالة حدوث حريق. يجب اعتبار الأنظمة الزائدة لكلا هذين المجالين المهمين وصيانتهما بانتظام.
مواقع التعافي البارد والدافئ والساخن والسحابية (Cold, Warm, Hot, and Cloud Sites):
قد تتضمن خطة التعافي من الكوارث توفير موقع تعافي يمكن تشغيله بسرعة، وتنقسم هذه المواقع إلى ثلاث فئات: ساخنة، ودافئة، وباردة. تعتمد الحاجة إلى كل نوع من هذه المواقع إلى حد كبير على العمل الذي تقوم به والأموال المتاحة، وتمثل مواقع التعافي من الكوارث أقصى درجات الحيطة للمنظمات التي تحتاج إليها. نتيجة لذلك، فهي ليست رخيصة.
المفهوم الأساسي لموقع التعافي من الكوارث هو أنه يمكن أن يوفر قاعدة يمكن من خلالها تشغيل الشركة أثناء الكارثة. لا يقصد بموقع التعافي من الكوارث أن يوفر مكتبًا لكل موظف، ويقصد به أكثر كوسيلة للسماح للأفراد الرئيسيين بمواصلة وظائف العمل الأساسية.
بشكل عام، موقع التعافي البارد هو الذي يمكن أن يكون جاهزًا للعمل في فترة قصيرة نسبيًا، مثل يوم أو يومين. يتم الاعتناء بتوفير الخدمات مثل خطوط الهاتف والطاقة، وقد تكون الأثاث المكتبية الأساسية في مكانها، ولكن من غير المرجح أن يكون هناك أي معدات حاسوب، حتى لو كان المبنى يحتوي على بنية تحتية للشبكة وغرفة جاهزة للعمل كغرفة خوادم. في معظم الحالات، توفر المواقع الباردة الموقع الفعلي والخدمات الأساسية.
تكون المواقع الباردة مفيدة إذا كان لديك بعض التحذير من مشكلة محتملة. بشكل عام، تستخدم المنظمات المواقع الباردة التي يمكنها تحمل العطل ليوم أو يومين قبل أن تعود للعمل، إذا كنت المكتب الإقليمي لشركة كبيرة، فقد يكون من الممكن لأحد الفروع الأخرى الاهتمام بالعمل حتى تكون جاهزًا، ولكن إذا كنت المكتب الوحيد في الشركة، فقد تحتاج إلى شيء أكثر حرارة.
للمنظمات التي لديها الأموال والرغبة، تمثل مواقع التعافي الساخنة أقصى درجات استراتيجيات تحمل الأخطاء. مثل مواقع التعافي الباردة، تم تصميم المواقع الساخنة لتوفير فقط المرافق الكافية لمواصلة الوظائف الأساسية للأعمال، ولكن تم تجهيز مواقع التعافي الساخنة لتكون جاهزة للعمل في أي لحظة.
نصيحة أختبار:
فكر في الموقع الساخن كمرآة للشبكة الإنتاجية للمنظمة ويمكنه تولي عمليات الشبكة في أي لحظة، وتحتوي المواقع الدافئة على المعدات اللازمة لجعل الشبكة في حالة تشغيل ولكنها تتطلب التكوين وتحديثات قاعدة البيانات المحتملة، ويحتوي الموقع البارد على المساحة المتاحة مع الخدمات الأساسية ولكنه يتطلب عادةً تسليم المعدات.
أحد الأنواع الأحدث من المواقع التي يتم تسويقها هو الموقع السحابي، ويشبه الموقع السحابي الموقع الدافئ، حيث يكون متاحًا عند الحاجة، والفرق بين الموقع السحابي والموقع الدافئ هو أن الموقع الدافئ يكون غالبًا مخصصًا للشركة، بينما الموقع السحابي يتم التحكم فيه من قبل مزود الخدمة الذي قد يعرض توافره للعديد من الشركات المختلفة (مثل بوليصة تأمين) مع العلم أن الاحتمالات جيدة بأن واحدة فقط ستحتاج إليه في وقت معين.
مفاهيم التوافر العالي والتعافي (High Availability and Recovery Concepts):
تشير الوظائف التجارية الحيوية إلى تلك العمليات أو الأنظمة التي يجب أن تكون جاهزة للتشغيل فورًا عند حدوث انقطاع، ولا يمكن للشركة العمل بدونها، والعديد منها يعتمد على المعلومات ويحتاج إلى الوصول إلى كل من التكنولوجيا والبيانات، وعند تقييم استدامة عملك، أدرك أن الكوارث تحدث بالفعل، وإذا كان ذلك ممكنًا، قم ببناء بنى تحتية لا تحتوي على نقطة فشل واحدة (SPOF) أو اتصال. إذا كنت المسؤول عن شركة صغيرة، فمن الشائع أن تكون نقطة الفشل الوحيدة هي الراوتر/البوابة، ولكن يجب تحديد جميع العقد والأصول الحيوية. أفضل طريقة لإزالة نقطة الفشل الوحيدة من بيئتك هي إضافة التكرار.
اعلم أن كل قطعة من المعدات يمكن تقييمها من حيث متوسط الوقت بين الأعطال (MTBF) ومتوسط الوقت للاسترداد (MTTR) MTBF هو قياس حدوث الأعطال المتوقع أو المتوقع لنظام أو مكون بين الأعطال المتأصلة، بينما MTTR هو قياس الوقت المستغرق لإصلاح نظام أو مكون بعد حدوث العطل.
هدف وقت الاسترداد (RTO) هو الحد الأقصى للوقت الذي يُسمح فيه بوقف عملية أو خدمة وتظل العواقب مقبولة. بعد هذا الوقت، يُعتبر الانقطاع في استمرارية الأعمال يؤثر سلبًا على العمل. هدف نقطة الاسترداد (RPO) هو الحد الأقصى للوقت الذي يمكن فيه فقدان المعاملات من حادث كبير - كم أنت مستعد لفقده من أجل إعادة تشغيل كل شيء، يجب موازنة كل من RTO و RPO في صياغة سياسة لكيفية التعامل مع الحوادث.
نصيحة أختبار:
مفاهيم التوافر العالي والتعافي (High Availability and Recovery Concepts):
تشير الوظائف التجارية الحيوية إلى تلك العمليات أو الأنظمة التي يجب أن تكون جاهزة للتشغيل فورًا عند حدوث انقطاع، ولا يمكن للشركة العمل بدونها، والعديد منها يعتمد على المعلومات ويحتاج إلى الوصول إلى كل من التكنولوجيا والبيانات، وعند تقييم استدامة عملك، أدرك أن الكوارث تحدث بالفعل، وإذا كان ذلك ممكنًا، قم ببناء بنى تحتية لا تحتوي على نقطة فشل واحدة (SPOF) أو اتصال. إذا كنت المسؤول عن شركة صغيرة، فمن الشائع أن تكون نقطة الفشل الوحيدة هي الراوتر/البوابة، ولكن يجب تحديد جميع العقد والأصول الحيوية. أفضل طريقة لإزالة نقطة الفشل الوحيدة من بيئتك هي إضافة التكرار.
اعلم أن كل قطعة من المعدات يمكن تقييمها من حيث متوسط الوقت بين الأعطال (MTBF) ومتوسط الوقت للاسترداد (MTTR) MTBF هو قياس حدوث الأعطال المتوقع أو المتوقع لنظام أو مكون بين الأعطال المتأصلة، بينما MTTR هو قياس الوقت المستغرق لإصلاح نظام أو مكون بعد حدوث العطل.
هدف وقت الاسترداد (RTO) هو الحد الأقصى للوقت الذي يُسمح فيه بوقف عملية أو خدمة وتظل العواقب مقبولة. بعد هذا الوقت، يُعتبر الانقطاع في استمرارية الأعمال يؤثر سلبًا على العمل. هدف نقطة الاسترداد (RPO) هو الحد الأقصى للوقت الذي يمكن فيه فقدان المعاملات من حادث كبير - كم أنت مستعد لفقده من أجل إعادة تشغيل كل شيء، يجب موازنة كل من RTO و RPO في صياغة سياسة لكيفية التعامل مع الحوادث.
نصيحة أختبار:
للامتحان، تأكد من معرفة الفروق بين MTBF و MTTR و RTO و RPO. اعرف ما تعنيه هذه الاختصارات وما تعنيه.
تقنيات تساعد في التوافر:
- تحمل الأعطال هو القدرة على تحمل خطأ (عطل) دون فقدان البيانات، ويمكن تحقيق ذلك من خلال استخدام RAID، النسخ الاحتياطية، والتقنيات المماثلة، ومن تطبيقات RAID التي تتحمل الأخطاء شعبية هي RAID 1 و RAID 5 و RAID 10.
- توزيع الأحمال هو تقنية يتم فيها توزيع عبء العمل بين عدة خوادم، وهذه الميزة يمكن أن تأخذ الشبكات إلى المستوى التالي؛ فهي تزيد من أداء الشبكة وموثوقيتها وتوافرها، ويمكن أن يكون موزع الأحمال جهازًا ماديًا أو برنامجًا تم تكوينه خصيصًا لتوزيع الحمل.
- المسارات المتعددة هو مفهوم الإدارة والاستخدام المتزامن لعدة مسارات متاحة لنقل تدفقات البيانات. من خلال زيادة المسارات المتاحة التي يمكن أن تسلكها البيانات، غالبًا من خلال إدخال التكرار، ويمكن تقليل احتمال فشل المسار الذي يوقف العمليات.
- المعدات الزائدة هي مكون رئيسي لضمان بقاء الأنظمة عاملة في حالة فشل أي مكون واحد، ويمكن أن ينطبق التكرار على المحولات، أجهزة التوجيه، جدران الحماية، وأي قطعة أخرى من المعدات تعتمد عليها عمليات الشبكة.
- تجميع بطاقات الشبكة (NIC teaming) هو عملية جمع عدة بطاقات شبكة لأسباب تتعلق بالأداء والتكرار (تحمل الأخطاء)، ويمكن أيضًا أن يُطلق عليه الربط أو الموازنة أو التجميع.
- تجميع المنافذ هو جمع عدة منافذ على المحول؛ يمكن القيام بذلك بإحدى ثلاث طرق: تلقائي، مرغوب، أو تشغيل.
استخدام الفحص الثغري واختبار الاختراق لاكتشاف نقاط الضعف في أنظمتك قبل أن يكتشفها الآخرون. تأكد من أن توعية المستخدمين النهائيين والتدريب هما أولويات عندما يتعلق الأمر بتحديد المشاكل والتأكيد على الالتزام بالمعايير والسياسات. يجب أن تتضمن هذه السياسات:
- سياسات الشبكة: مشابهة لسياسات AUPs، تصف هذه السياسات الاستخدامات المقبولة لموارد الشبكة.
- سياسات الأمان: تحدد سياسات الأمان ما هي الضوابط المطلوبة لتنفيذ وصيانة أمان الأنظمة والمستخدمين والشبكات، ويجب استخدام هذه السياسات كأدلة في تنفيذ النظام وتقييماته، واحدة من السياسات الجديرة بالذكر هي سياسة الموافقة على المراقبة حيث يقر الموظفون والمستخدمون الآخرون للشبكة بأنهم يعرفون أنهم مراقبون ويوافقون على ذلك.
نصيحة أختبار:
أثناء دراستك للامتحان، ثلاثة مواضيع يجب الانتباه إليها هي الالتزام بالمعايير والسياسات، الفحص الثغره، واختبار الاختراق.
الأنظمة النشطة-النشطة مقابل النشطة-الاحتياطية (Active-Active Versus Active-Passive):
عندما يتعلق الأمر بالتوافر العالي، فإن الحلول تنقسم إلى نوعين من النهج: النشطة-النشطة والنشطة-الاحتياطية، والفرق بين الاثنين بسيط للغاية: إذا كانت الأجهزة التي ستستخدم في حالة الفشل قيد الاستخدام عادةً، فهذا يعتبر نشط-نشط لأنها نشطة حاليًا، ومثال على ذلك هو العقد في التجمع: جميعها قيد الاستخدام حاليًا ويمكن أن تستمر في العمل في حالة الفشل.
من ناحية أخرى، إذا لم يكن الجهاز قيد الاستخدام حاليًا ولكنه يتم تنشيطه عند الفشل (فشل التحويل)، فهذا يعتبر نشط-احتياطي، مثال على ذلك هو وجود عدة مزودي خدمات هاتف أو خدمات إنترنت (ISPs) قادرين على تقديم الخدمة لمنشأة واستخدام واحدة فقط إلا إذا توقفت خدمتها، في هذه الحالة يتم تنشيط الآخرين.
ويمكن تحقيق التكرار والتوافر عن طريق التعاقد مع عدة مزودي خدمات إنترنت لإنشاء مسارات متنوعة وضمان بقاء الاتصال في حالة فشل أحد مزودي الخدمة. يمكن أيضًا استخدام التكرار مع أجهزة التوجيه من خلال استخدام بروتوكول التكرار الافتراضي للموجه (VRRP) وبروتوكول التكرار للخطوة الأولى (FHRP).
نصحية أختبار:
للامتحان، كن قادرًا على شرح الفروق بين VRRP و FHRP.
النهاية:
لم يتبقى إلا القليل ، الى الجزء الثالث ، شكراً لكم على القراء ، وقراءه ممتعة ، إن كنت تريد ان تعطينا رأيك وتشاركنا به ، أنضم الى مجتمعنا من هنا.
لم يتبقى إلا القليل ، الى الجزء الثالث ، شكراً لكم على القراء ، وقراءه ممتعة ، إن كنت تريد ان تعطينا رأيك وتشاركنا به ، أنضم الى مجتمعنا من هنا.