يعمل نظام النسخ الاحتياطي للبنك (DBS) على أساس برنامج Veritas NetBackup لفترة طويلة. لكن المعدات التي كانت تدور عليها شركة SRC لم تعد قادرة على تحمل العبء.
كانت إشارة وجود مشكلة وشيكة عدم وجود نافذة احتياطية. لم يعد لدى SRK الوقت لإجراء نسخ احتياطي للبيانات من الخوادم ومحطات العمل بين عشية وضحاها ، وتم توزيع بعض المهام على ساعات العمل. نتيجة لذلك ، بالنسبة لبعض الموارد ، لم يتم عمل نسخ كل يوم ، مما أدى إلى خطر فقدان البيانات وانتهاك مستوى اتفاقية مستوى الخدمة في حالة حدوث فشل حقيقي.
مشكلة أخرى هي عدم وجود مساحة على مكتبة القرص. للتعويض عن ذلك بطريقة أو بأخرى ، قام العميل بتقليل وقت تخزين النسخ الاحتياطية على مكتبة القرص من 14 يومًا إلى 7 أيام. وضع هذا ضغطًا إضافيًا على محركات أقراص مكتبة الأشرطة ، والتي تم استخدامها بالكامل تقريبًا على أي حال.
تم استخدام مكتبة الأقراص لتخزين النسخ الاحتياطية عبر الإنترنت وتوفير التنفيذ المتوازي لوظائف النسخ الاحتياطي حتى 25 سلسلة في وقت واحد.
تم استخدام مكتبة الأشرطة للتخزين طويل المدى. وفقًا لمتطلبات الجهة المنظمة ، يجب تخزين المستندات المختلفة من 1 إلى 5 سنوات. مع زيادة أخرى في العبء ، سيواجه العميل مشاكل في الامتثال للوائح البنك المركزي. ليست نظرة إيجابية للغاية.
يتغيرون؟ يصلح؟ وسعت؟ تطوير؟
عندما بدأ شاروخان في "الاختناق" ، يقترب من الحد الأقصى لإنتاجيته ، كان لدى العميل سؤال - أين "عنق الزجاجة" للنظام؟ نظرًا لأننا نشارك في صيانة جزء البرنامج من SRK ، فقد طلبت منا خدمة تكنولوجيا المعلومات في البنك تحليل تشغيل النظام.
تضمن الحل في ذلك الوقت المكونات التالية:
- 1 × خادم NetBackup Solaris x86 الرئيسي / خادم الوسائط
- 1 × VMware Backup Media Server ؛
- 45 × خوادم وسائط AIX
- 10 × خوادم وسائط SPARC Solaris ؛
- 1 x Dell EMC Data Domain 4200 Disk Library في وضع VTL ؛
- 1 × مكتبة أشرطة Oracle SL3000 مع 8 محركات LTO6.
لتخزين النسخ الاحتياطية عبر الإنترنت ، تم تسجيل عدة تدفقات من النسخ الاحتياطية من خوادم الوسائط وعملاء Enterprise في وقت واحد باستخدام بروتوكول FC إلى مكتبة القرص. تم بعد ذلك نسخ النسخ احتياطيًا على شريط وسائط مكتبة Oracle SL3000 من خلال خادم الوسائط / NetBackup الرئيسي عبر بروتوكول FC.
لدى البنك 830 عميل SRK ، بما في ذلك حوالي 730 جهازًا ظاهريًا VMware وعملاء Enterprise على AIX و Solaris وخوادم x86 المادية. كان الحجم الأصلي لنسخة كاملة من البيانات الاحتياطية 115 تيرابايت.
للعثور على عنق الزجاجة ، نظرنا إلى إحصائيات تنفيذ مهمة NetBackup ، وتهيئة الإدخال / الإخراج لخادم الوسائط ، وتكوين SAN ، واستخدام محرك مكتبة الأشرطة ، وأداء مكتبة الأقراص. لهذا ، قدم لنا العميل تقارير تشخيصية:
- nbsu - أداة دعم Veritas NetBackup ؛
- NetBackup DeployUtil ومواصفات ترخيص البرنامج ؛
- Brocade SAN Health على تكوين SAN ؛
- الدعم التلقائي من مكتبة أقراص مجال البيانات.
يوفر تقرير nbsu - أداة دعم Veritas NetBackup المساعدة معلومات شاملة عن تكوين NetBackup ، بما في ذلك معلومات أداء مهام النسخ الاحتياطي. يتم تقديم هذه المعلومات في ملف تفريغ bpdbjobs - most_columns. لكن عليك أن تكون قادرًا على تحليلها ، وتحويل التواريخ والأوقات من تنسيق العصر إلى تنسيق يمكن قراءته.
يساعدك إخراج الأمر bpdbjobs على تقييم أداء ومدة كل وظيفة. هذه هي الطريقة التي يمكنك من خلالها الحصول على صورة للتخلص من محركات أقراص مكتبة الأشرطة على نطاق زمني :
يحتوي nbsu على بيانات حول الوسائط المستخدمة وفترات الاستبقاء وتوزيعها عبر المجمعات. يوجد أدناه ملخص لأوقات استبقاء الوسائط بناءً على NBU_available_media.txt من nbsu.
يقدر تقرير NetBackup DeployUtil الاستهلاك الفعلي لتراخيص برامج النسخ الاحتياطي لنماذج الترخيص المختلفة - التقليدية والسعة. يتم إنشاؤه في MS Excel ، ويحتوي على قائمة كاملة من عملاء النسخ الاحتياطي ، ومعلومات حول النظام الأساسي للخوادم الزائدة عن الحاجة ، والإصدار المستخدم من NetBackup وكمية البيانات التي يتم نسخها احتياطيًا.
يصف تقرير Brocade SAN Health طوبولوجيا SAN وتكوين تقسيم المناطق وإلقاء نظرة على استخدام ارتباطات ISL.
"يتحدث" الدعم التلقائي لمجال البيانات عن تكوين مكتبة القرص وكفاءة التخزين والأداء. بعد التحليل ، حددنا الأنماط وحصلنا على خريطة الحرارة للحمل:
نتيجة لذلك ، اتضح أن "الرابط الضعيف" كان مكتبة قرص Dell EMC Data Domain 4200 ، والتي تعمل في وضع VTL.
قمنا بمقارنة المعلمات الفعلية والمتطلبات الشكلية لحجم النسخ الاحتياطية وتواترها. اتضح أن السعة الحالية والأداء لمكتبة الأقراص لا توفر تخزين الأقراص المدمجة التشغيلية مع الفترة المطلوبة. علاوة على ذلك ، وبسبب قيود سرعة القراءة من Dell EMC DD4200 على وجه التحديد ، حدث تكرار المعلومات على الأشرطة في وضع قريب من الحد الأقصى. يرجع الأداء المنخفض لـ DD للقراءة إلى العملية كثيفة الموارد لإعادة تميؤ المعلومات - استعادة تسلسل الكتل إلى شكلها الأصلي قبل إلغاء المضاعفة.
كل شيء يشير إلى الحاجة إلى استبدال مكتبة الأقراص القديمة. احتاج العميل إلى أجهزة يمكنها دعم 5-6 تيرابايت من البيانات في الساعة ، مع وحدات تحكم إضافية لتحمل الأخطاء وزيادة السعة.
ثلاثة مرشحين للاختيار من بينهم
كان الاقتراح الأكثر وضوحًا في هذه الحالة هو استبدال Dell EMC Data Domain بإصدار أحدث. أو يمكن أن يكون جهاز Veritas NetBackup بديلاً. (هذا مشابه إلى حد كبير لنطاق البيانات ، وفي نفس فئة الأسعار). لكن كلا الخيارين أثار مخاوف بشأن الميزانية.
الخيار الثالث هو حل يعتمد على خوادم معمارية قياسية مع ميزة إلغاء البيانات المكررة الأصلية Veritas NetBackup - Media Server Deduplication Pool (MSDP).
عندما وصلنا إلى العميل باقتراح ، اتضح أنه قد فكر بالفعل في الحلول القائمة على كل من Veritas NetBackup Appliance و Dell EMC Data Domain من البائعين الآخرين ، لكن العميل لم يكن متأكدًا من مدى مثلى كانت من حيث نسبة السعر / النتيجة. وبعبارة أخرى ، فإن نسختنا على الخوادم القياسية أصبحت مفيدة.
بينما كان البنك يختبر التكوينات استنادًا إلى Veritas NetBackup Appliance ، نصحنا فريق تكنولوجيا المعلومات الخاص بالعميل بشأن تفاصيل استخدام إلغاء البيانات المكررة من Veritas ، والفروق الدقيقة في تقنية نقل الألياف لنقل حركة مرور SRK عبر SAN ، وآليات إنشاء نسخ تركيبية تعتمد على تقنية NetBackup Accelerator ، واقترحنا تمكين التحقق من هذه التقنيات في برنامج الاختبار. بناءً على نتائج الاختبار ، وافق العميل على حلنا استنادًا إلى خادمين قياسيين x86 مع تخزين كتلة ، حيث تم تطبيق مجموعة التقنيات المختبرة بالكامل فيه.
قمنا أيضًا بإعداد اقتراح لاستبدال Dell EMC Data Domain 4200 بمكتبة أحدث. بالنسبة لهذا المشروع ، تم اختيار طراز Dell EMC Data Domain 6800 HA - وهو نموذج أكثر قوة وواسعة وإنتاجية. كانت ميزة الحل هي التوافر الكبير للمكتبة في تكوين وحدة تحكم مزدوجة. مكتبة القرص في هذا التكوين لم تعد نقطة فشل واحدة. في حالة فقدان وحدة التحكم ، ستظل المكتبة متاحة من خلال تقنية NPIV وستستمر مهام النسخ الاحتياطي تلقائيًا.
في حالة اختيار حل يعتمد على مجال البيانات ، لا يحتاج العميل إلى استبدال برنامج العميل الخاص بـ SRK Enterprise-client بعميل SAN ، وكان حجم العمل "لتضمينه" في مشهد تكنولوجيا المعلومات ضئيلاً. كانت هذه إضافة أخرى لنطاق بيانات Dell EMC 6800 HA.
المزيد من القوة + DD BOOST
تدعم مكتبة القرص Dell EMC Data Domain 6800 وضع وحدة التحكم المزدوجة (توفر عالي) ، ويمكن أن تعمل ليس فقط مع بروتوكول VTL ، ولكن أيضًا مع DD BOOST. تتمتع المكتبة الجديدة بسعة قابلة للاستخدام تبلغ 174 تيرابايت باستثناء إلغاء البيانات المكررة والضغط ، في حين أن Dell EMC DD4200 يقتصر على 130 تيرابايت. علاوة على ذلك ، قمنا بتقدير السرعة المتوقعة لمكتبة الأقراص وأظهرنا للعميل أنها يجب أن تكون من 5.3 إلى 8 تيرابايت في الساعة مع الكتابة والقراءة المتزامنة ، مما يغطي احتياجاته بالكامل من النسخ الاحتياطي ونقل البيانات إلى الأشرطة.
أثبت الدعم المتزامن لـ DD Boost و VTL أنه مفيد حيث كان من الممكن الجمع بين استخدام التقنيات في حالة مشكلات التوافق. فوائد DD Boost واضحة:
- ;
- ( ) (image);
- DD Boost , - NetBackup;
- NetBackup ;
- .
نظرًا لأن النظام البيئي للبنك يعتمد على ظاهرية VMware ، فإن NetBackup Accelerator لـ Vmware هو أيضًا ميزة مفيدة لـ DD Boost. تتعقب هذه التقنية الكتل التي تم تغييرها من VMware CBT (تتبع الكتلة المتغيرة) ، وبناءً على تقنية إلغاء البيانات المكررة ، تُنشئ نسخة احتياطية اصطناعية كاملة أثناء عملية إضافية. في الوقت نفسه ، يتم الاحتفاظ بإمكانية الاسترداد الدقيق للملفات وتطبيقات Microsoft (AD ، SQL ، Exchange ، SharePoint) من النسخ الاحتياطية للجهاز الظاهري.
أكثر بأسعار معقولة ، ولكن ليس أفضل
قام فريقنا بحساب تكاليف التبديل إلى خيارات متنوعة للمكتبات الجديدة. اتضح أن إعادة تنظيم SRC باستخدام خوادم قياسية سيتطلب المزيد من أعمال التكامل. ولكن الشيء الأكثر إزعاجًا هو المخاطر الإضافية للأعمال: استبدال برنامج النسخ الاحتياطي للعميل ، وإعادة تكوين السياسات ، ونتيجة لذلك ، قد يكون هناك تعطل محتمل للخوادم الأكثر أهمية (أكثر من 50 خادم AIX / Solaris).
نتيجة لذلك ، اختار العميل الانتقال إلى Dell EMC Data Domain 6800.
كان Dell EMC Data Domain 6800 هو البديل الأكثر تكلفة. لكن استخدامه جعل من الممكن تقليل تكلفة التحديث بشكل عام: عدم تغيير البنية التحتية لـ RMS ، لتقليل مخاطر فقدان البيانات وعدم توفر الخدمة ، وكذلك عدم التخلي عن المكتبة القديمة. لذا ، فإن إضافة DD آخر إلى النظام زاد من سعة التخزين بأكثر من الضعف ، ولا شيء لي في العمليات التي تم تصحيحها بالفعل. لم يتطلب الحفاظ على دعم VTL تكوينًا إضافيًا على خوادم وسائط NetBackup وعملاء المؤسسة. لم تكن هناك حاجة أيضًا لتغيير برنامج النسخ الاحتياطي للعميل ، وتم إعادة توزيع مهام النسخ الاحتياطي بسهولة بين مكتبات الأقراص - DD4200 المثبت بالفعل و DD6800 الجديد. تظل سياسات SLP الخاصة بنقل النسخ الاحتياطية إلى الأشرطة كما هي ،تأتي البيانات فقط الآن من مكتبتي أقراص.
الانتقال إلى نظام جديد
يوجد أدناه مخطط الحل المستهدف:
بحلول الوقت الذي تم فيه تقديم مكتبة الأقراص الجديدة ، كانت الحاجة إلى توسيع سعة النسخ الاحتياطي ملحة للغاية لدرجة أن البنك كان مستعدًا لدعم الإنتاج إليها حتى يتم الانتهاء من جميع الاختبارات. تمكنا من ثني العميل عن هذه الخطوة. لقد أجرينا جميع الفحوصات على برنامج الاختبار ، بما في ذلك اختبارات تجاوز الفشل المدمرة.
تم التنفيذ بسرعة. بعد أسبوعين ، كان البنك يدير مكتبة أقراص جديدة. نتيجة لذلك ، حصل العميل على نظام بسعة أكبر وهامش أداء كافٍ للسنوات القليلة القادمة. مؤشرات الأداء في الواقع تجاوزت حتى تلك المحسوبة. الأداء الفعلي لـ DD 6800 هو 8-9 تيرابايت في الساعة (محسوبة من 5.3 تيرابايت) ، وتبلغ السعة ، مع مراعاة إلغاء البيانات المكررة والضغط ، حوالي 1 بيتابايت.
نظرًا لأننا قمنا ببساطة بتوسيع سعة التخزين ولم نغير البنية ، ظلت تكلفة تراخيص NetBackup للبنك كما هي - لم يتغير شيء من حيث النسخ الاحتياطي للبيانات وعدد العملاء. تعمل المكتبة الجديدة الآن بالتوازي مع Dell EMC DD 4200 ، لكن سعتها كافية تمامًا لإيقاف تشغيل المكتبة القديمة ، إذا لزم الأمر.
دراسة عميقة في بداية المشروع من حيث تكاليف العمالة "فاقت" إدخال المكتبة الجديدة. في الواقع ، أكملنا مشروعًا استشاريًا صغيرًا مع سوء تقدير للخيارات الممكنة لـ 0 روبل. لكن كما اتضح ، لم يكن الأمر عبثًا. سمح ذلك للعميل بالحصول على مبرر للتحديث وتقليل المخاطر واتخاذ قرار مستنير.
المؤلف: أليكسي بولياكوف ، مهندس تصميم أنظمة تخزين البيانات ، أنظمة المعلومات النفاثة