كيف بحثنا عن أجهزة استشعار معطلة في URALCHEM (مشروع بحيرة البيانات الأول)

صورة



URALCHEM يصنع الأسمدة. رقم 1 في روسيا - لإنتاج نترات الأمونيوم ، على سبيل المثال ، من بين أكبر 3 منتجين محليين للأمونيا واليوريا والأسمدة النيتروجينية. يتم إنتاج أحماض الكبريتيك والأسمدة المكونة من مكونين اثنين والفوسفات وأكثر من ذلك بكثير. كل هذا يخلق بيئات عدوانية تفشل فيها أجهزة الاستشعار.



قمنا ببناء Data Lake وفي الوقت نفسه بحثنا عن تلك المستشعرات التي تتجمد وتفشل وتبدأ في إعطاء بيانات خاطئة وتتصرف بشكل عام بشكل مختلف عن الطريقة التي يجب أن تتصرف بها مصادر المعلومات. و "الحيلة" هي أنه من المستحيل بناء نماذج رياضية وتوائم رقمية على أساس البيانات "السيئة": فهي ببساطة لن تحل المشكلة بشكل صحيح وتعطي تأثيرًا تجاريًا.



لكن المصانع الحديثة تحتاج إلى Data Lake لعلماء البيانات. في 95٪ من الحالات ، لا يتم جمع البيانات "الأولية" بأي شكل من الأشكال ، ولكن يتم أخذ المجاميع في نظام التحكم في العملية فقط في الاعتبار ، والتي يتم تخزينها لمدة شهرين ويتم تخزين نقاط "التغيير في ديناميكيات" المؤشر ، والتي يتم حسابها بواسطة خوارزمية موضوعة خصيصًا ، والتي تقلل لعلماء البيانات من جودة البيانات ، لأن . ، ربما ، قد تفوت "رشقات" المؤشر ... في الواقع ، شيء من هذا القبيل كان في URALCHEM. كان من الضروري إنشاء مستودع لبيانات الإنتاج ، والتقاط المصادر في المتاجر وأنظمة MES / ERP. بادئ ذي بدء ، يعد هذا ضروريًا لبدء جمع التاريخ لعلوم البيانات. ثانيًا ، بحيث يكون لدى علماء البيانات منصة لحساباتهم وصندوق رمل لاختبار الفرضيات ، وليس تحميل نفس النظام الذي يدور فيه نظام التحكم في العملية.حاول علماء البيانات تحليل البيانات المتاحة ، لكن هذا لم يكن كافيًا. تم تخزين البيانات هالكة ، مع خسائر ، وغالبًا ما تتعارض مع المستشعر. لم يكن من الممكن أخذ مجموعة البيانات بسرعة ، ولم يكن هناك مكان للعمل معها أيضًا.



الآن دعنا نعود إلى ما يجب فعله إذا كان المستشعر "يقود".



عندما تبني بحيرة



لا يكفي مجرد بناء شيء من هذا القبيل:



صورة



تحتاج أيضًا إلى أن تثبت للأعمال التجارية أن كل شيء يعمل ، وأن تعرض مثالاً لمشروع واحد مكتمل. من الواضح أن القيام بمشروع واحد على مثل هذا الجمع يتعلق بكيفية بناء الشيوعية في بلد واحد ، لكن الظروف هي بالضبط كذلك. نأخذ مجهرًا ونثبت أنه يمكن أن يطرق في الظفر.



على الصعيد العالمي ، تم تكليف URALCHEM برقمنة الإنتاج. كجزء من كل هذا الإجراء ، أولاً وقبل كل شيء ، قم بإنشاء صندوق رمل لاختبار الفرضيات ، وزيادة كفاءة عملية الإنتاج ، وكذلك تطوير نماذج تنبؤية لأعطال المعدات وأنظمة دعم القرار وبالتالي تقليل عدد فترات التوقف عن العمل وتحسين جودة عمليات الإنتاج. هذا عندما تعرف مسبقًا أن شيئًا ما على وشك الفشل ، ويمكنك إصلاحه قبل أسبوع من بدء الجهاز في تحطيم كل شيء حوله. الفائدة - في تقليل تكاليف الإنتاج وتحسين جودة المنتج.



هذه هي الطريقة التي ظهرت بها معايير النظام الأساسي والمتطلبات الأساسية للطيار: تخزين كمية كبيرة من المعلومات ، والوصول الفوري إلى البيانات من أنظمة ذكاء الأعمال ، والحسابات القريبة من الوقت الفعلي من أجل إصدار توصيات أو إخطارات في أقرب وقت ممكن.



لقد توصلنا إلى خيارات التكامل وأدركنا أنه من أجل الأداء والتشغيل في وضع NRT ، تحتاج إلى العمل فقط من خلال الموصل الخاص بك ، والذي سيضيف البيانات إلى كافكا (وسيط رسائل قابل للتوسع أفقيًا ، والذي يسمح لك فقط "بالاشتراك في الحدث" لتغيير قراءة المستشعر ، وبناءً على من هذا الحدث سريعًا لإجراء الحسابات وإنشاء الإخطارات). بالمناسبة ، ساعدنا أرتور خيسماتولين ، رئيس قسم تطوير أنظمة الإنتاج ، فرع OTSO في شركة URALCHEM JSC ، كثيرًا.



ما هو المطلوب ، على سبيل المثال ، لعمل نموذج تنبؤي لفشل المعدات؟



يتطلب هذا القياس عن بُعد من كل عقدة في الوقت الفعلي أو في شرائح قريبة منها. هذا ليس مرة واحدة في الساعة حالة عامة ، ولكن قراءات محددة مباشرة لجميع أجهزة الاستشعار لكل ثانية.



لا أحد يجمع أو يخزن هذه البيانات. علاوة على ذلك ، نحن بحاجة إلى بيانات تاريخية لمدة ستة أشهر على الأقل ، وفي نظام التحكم في العمليات ، كما قلت ، يتم تخزينها لمدة أقصاها الأشهر الثلاثة الماضية. أي أنك تحتاج أن تبدأ بحقيقة أنه سيتم جمع البيانات من مكان ما ، وسيتم كتابتها في مكان ما وتخزينها في مكان ما. بيانات تبلغ حوالي 10 غيغابايت لكل عقدة في السنة.



علاوة على ذلك ، سوف تحتاج إلى العمل مع هذه البيانات بطريقة ما. يتطلب هذا تثبيتًا يسمح لك عادةً بإجراء تحديدات من قاعدة البيانات. ومن المستحسن أن لا ينهض كل شيء في الصارة المعقدة ليوم واحد. خاصة في وقت لاحق ، عندما يبدأ الإنتاج في إضافة المزيد من مشاكل التنبؤ بالزواج. حسنًا ، بالنسبة للإصلاحات التنبؤية ، أيضًا ، تقرير مسائي يفيد بأن الآلة قد تتعطل عندما تتعطل قبل نصف ساعة - حالة سيئة



ونتيجة لذلك ، فإن البحيرة ضرورية لعلماء البيانات.



على عكس الحلول الأخرى المماثلة ، لا يزال لدينا مهمة الوقت الحقيقي على Hadoop. لأن المهام الكبيرة التالية هي بيانات عن تكوين المواد ، وتحليل جودة المواد ، واستهلاك المواد للإنتاج.



في الواقع ، عندما قمنا ببناء النظام الأساسي نفسه ، كان الشيء التالي الذي أراده العمل منا هو أننا نجمع البيانات حول فشل أجهزة الاستشعار ونبني نظامًا يسمح لنا بإرسال العمال لتغييرهم أو خدمتهم. وفي الوقت نفسه تشير شهاداتهم بأنها خاطئة في التاريخ.



مجسات



في الإنتاج - بيئة عدوانية ، تعمل المستشعرات بطريقة صعبة وغالبًا ما تفشل. من الناحية المثالية ، هناك حاجة أيضًا إلى نظام مراقبة تنبؤي لأجهزة الاستشعار ، ولكن أولاً ، على الأقل تقييم أيها يكذب وأيها لا يكذب.



اتضح أنه حتى النموذج البسيط لتحديد ما هو موجود مع المستشعر أمر بالغ الأهمية لمهمة أخرى - بناء توازن رياضي. التخطيط السليم للعملية - مقدار ما يجب وضعه وما الذي يجب وضعه فيه وكيفية تسخينه وكيفية معالجته: إذا كان التخطيط خاطئًا ، فليس من الواضح مقدار المواد الخام المطلوبة. لن يتم إنتاج منتجات كافية - لن تحقق المؤسسة ربحًا. إذا كان هناك أكثر من اللازم - مرة أخرى خسارة ، لأنه من الضروري التخزين. لا يمكن الحصول على توازن المواد الصحيح إلا من المعلومات الصحيحة من أجهزة الاستشعار.



لذلك ، في مشروعنا التجريبي ، تم اختيار مراقبة جودة بيانات الإنتاج.



جلسنا مع الفنيين للحصول على البيانات "الخام" ، ونظرنا إلى حالات فشل المعدات المؤكدة. السببان الأولان بسيطان للغاية.



هنا يبدأ المستشعر فجأة في إظهار البيانات التي ، من حيث المبدأ ، لا ينبغي أن تكون: على



صورة



الأرجح ، هذه الذروة المحلية هي اللحظة التي يصبح فيها المستشعر سيئًا حراريًا أو كيميائيًا.



هناك أيضًا تجاوز لحدود القياس المسموح بها (عندما تكون هناك كمية مادية مثل درجة حرارة الماء من 0 إلى 100). عند الصفر ، لا يتحرك الماء خلال النظام ، وعند 200 يكون بخارًا ، وكنا قد لاحظنا هذه الحقيقة بغياب سقف فوق الورشة.



الحالة الثانية أيضًا تافهة تقريبًا:



صورة



لا تتغير البيانات من المستشعر لعدة دقائق متتالية - وهذا لا يحدث في الإنتاج الحي. على الأرجح شيء مع الجهاز.



يتم إغلاق 80٪ من المشكلات من خلال تتبع هذه الأنماط دون أي بيانات كبيرة وارتباطات وتاريخ بيانات. ولكن للحصول على دقة أعلى من 99٪ ، تحتاج إلى إضافة مقارنة أخرى مع أجهزة استشعار أخرى في العقد المجاورة ، على وجه الخصوص ، قبل وبعد القسم الذي يأتي منه القياس عن بُعد المشكوك فيه:



صورة



الإنتاج نظام متوازن: إذا تغير أحد المؤشرات ، فيجب أن يتغير الآخر أيضًا. في إطار المشروع ، تم تشكيل قواعد حول علاقة المؤشرات ، وتم "تطبيع" هذه العلاقات من قبل التقنيين. بناءً على هذه الإرشادات ، يمكن للنظام المستند إلى Hadoop تحديد أجهزة الاستشعار التي قد لا تعمل.



كان مشغلو المصنع سعداء باكتشاف المستشعرات بشكل صحيح ، لأن هذا يعني أنه يمكنهم إرسال مصلح بسرعة أو ببساطة تنظيف المستشعر المطلوب.



في الواقع ، انتهى الطيار بإدراج أجهزة استشعار يحتمل أن تكون غير صالحة للعمل في المتجر والتي تظهر معلومات غير صحيحة.



يمكنك أن تسأل كيف تم تنفيذ الاستجابة للطوارئ وظروف ما قبل الطوارئ من قبل ، وكيف أصبحت بعد المشروع. سأجيب أن رد الفعل على حادث لا يتباطأ ، لأنه في مثل هذه الحالة تظهر عدة أجهزة استشعار المشكلة في وقت واحد.



إما أن يكون الفني أو رئيس القسم مسؤولاً عن كفاءة التركيب (والإجراءات في حالة وقوع حوادث) إنهم يفهمون تمامًا ما يحدث وكيف يحدث مع معداتهم ، ويمكنهم تجاهل بعض أجهزة الاستشعار. تعتبر أنظمة التحكم في العمليات المصاحبة للتثبيت مسؤولة عن جودة البيانات. عادة ، عند تلف المستشعر ، لا يتم وضعه في وضع عدم العمل. بالنسبة للتقني ، يظل عاملاً ؛ يجب أن يتفاعل التقني. يفحص التقني الحدث ويكتشف أنه لم يحدث شيء. يبدو كالتالي: "نحن نحلل الديناميكيات فقط ، لا ننظر إلى المطلق ، نعلم أنها غير صحيحة ، نحتاج إلى ضبط المستشعر". نحن "نبرز" للمختصين في نظام التحكم الآلي في العمليات أن المستشعر خاطئ وأين يكون خطأ. الآن ، بدلاً من جولة رسمية مخططة ، يقوم أولاً بإصلاح أجهزة معينة بطريقة مستهدفة ، ثم يقوم بجولات ، دون أن يثق في التكنولوجيا.



لتوضيح المدة التي تستغرقها المسيرة المخطط لها ، سأقول ببساطة أن هناك من ثلاثة إلى خمسة آلاف جهاز استشعار في كل موقع. لقد قدمنا ​​أداة تحليلات شاملة توفر البيانات المعالجة ، والتي على أساسها يحتاج المتخصص لاتخاذ قرار بشأن التحقق. بناءً على خبرته ، "نبرز" ما هو مطلوب بالضبط. لم تعد بحاجة إلى التحقق يدويًا من كل مستشعر ، كما تقل احتمالية فقدان شيء ما.



ما هي النتيجة



تم استلام تأكيد العمل بأنه يمكن استخدام المكدس لحل مشاكل الإنتاج. نقوم بتخزين ومعالجة بيانات الموقع. يجب أن تختار الشركة الآن العمليات التالية حتى يعمل علماء البيانات. أثناء تعيينهم شخصًا مسؤولاً عن مراقبة جودة البيانات ، قم بكتابة اللوائح له وتنفيذ ذلك في عملية الإنتاج الخاصة بهم.



هذه هي الطريقة التي طبقنا بها هذه الحالة:



صورة



تبدو لوحات التحكم كما يلي: يتم عرضها



صورة



صورة



في مثل هذه الأماكن:



صورة



ما لدينا:



  • تم إنشاء مساحة معلومات على المستوى التكنولوجي للعمل مع قراءات من أجهزة استشعار المعدات ؛
  • التحقق من القدرة على تخزين ومعالجة البيانات بناءً على تقنية البيانات الضخمة ؛
  • اختبرت قدرة أنظمة ذكاء الأعمال (على سبيل المثال ، Power BI) على العمل مع بحيرة بيانات مبنية على منصة Arenadata Hadoop ؛
  • تم إدخال تخزين تحليلي موحد لجمع معلومات الإنتاج من أجهزة استشعار المعدات مع إمكانية تخزين المعلومات على المدى الطويل (الحجم المخطط للبيانات المتراكمة للسنة حوالي 2 تيرابايت) ؛
  • تم تطوير آليات وطرق للحصول على البيانات في وضع شبه الوقت الحقيقي ؛
  • تم تطوير خوارزمية لتحديد الانحرافات والتشغيل غير الصحيح لأجهزة الاستشعار في وضع الوقت الفعلي القريب (الحساب - مرة واحدة في الدقيقة) ؛
  • تم إجراء اختبارات تشغيل النظام وإمكانية إنشاء التقارير في أداة BI.


خلاصة القول هي أننا قمنا بحل مشكلة إنتاج بالكامل - لقد أتممتنا عملية روتينية. قدمنا ​​أداة تنبؤ ووفرنا الوقت للتقنيين لحل مشاكل أكثر ذكاءً.



وإذا كان لا يزال لديك أسئلة ليس للتعليقات ، فإليك البريد الإلكتروني - chemistry@croc.ru



All Articles