كيفية تمييز الوجه الحقيقي من الزائف في التعرف على الوجوه

صورة



وصف قصير



لا يزال التمييز بين وجه الشخص الحقيقي والوجه المزيف في الكاميرا من أصعب المشاكل في أنظمة التحكم والوصول إلى المباني. تم اقتراح خوارزمية لاكتشاف وميض العين في الوقت الفعلي في تسلسل فيديو من كاميرا قياسية ، مما يعطينا حقيقة أن الشخص الموجود في الكاميرا حقيقي. تُظهر أحدث أجهزة الكشف عن المعالم ، المدربة على مجموعات البيانات في هذا المجال ، مقاومة ممتازة لاتجاه الرأس بالنسبة للكاميرا ، وظروف الإضاءة المتغيرة وتعبيرات الوجه. نظهر أن المعالم يتم اكتشافها بدقة كافية لتقدير مستوى فتح العين بشكل موثوق. وهكذا ، فإن الخوارزمية المقترحة تقدر موضع المعالم ، وتستخلص عددًا واحدًا - نسبة قاع العين (EAR) - تميز فتحة العين في كل إطار. أخيرا،يكتشف مصنف SVM وميض العين كنمط لقيم EAR في نافذة زمنية قصيرة. تتفوق الخوارزمية البسيطة على النتائج الحديثة في مجموعتي بيانات قياسيتين.



مكتبة Dlib



في هذه المقالة ، أستخدم فهارس الوجه لمناطق وجه dlib . ينتج كاشف معالم الوجه المنفذ داخل مكتبة dlib 68 إحداثيات (س ، ص) التي تم تعيينها لهياكل وجه معينة. تم الحصول على تعيينات 68 نقطة هذه من خلال تدريب توقع الشكل على مجموعة بيانات iBUG 300-W المسمى .



أدناه يمكننا تصور ما تم تعيين كل من هذه الإحداثيات الـ 68: الشكل 1 - عرض كل نقطة من نقاط إحداثيات الوجه الـ 68 من مجموعة بيانات iBUG 300-W من خلال فحص الصورة ، يمكننا أن نرى أنه يمكن الوصول إلى مناطق الوجه من خلال فهرسة Python البسيطة ( بافتراض عدم وجود فهرسة باستخدام Python حيث أن الصورة أعلاه مفهرسة):













  • يمكن الوصول إلى الفم من خلال النقاط [49 ، 68].
  • الحاجب الأيمن من خلال النقاط [18 ، 22].
  • الحاجب الأيسر من خلال النقاط [23 ، 27].
  • العين اليمنى من خلال النقاط [37 ، 42].
  • العين اليسرى من خلال النقطتين [43 ، 48].
  • الأنف من خلال النقاط [28 ، 36].
  • ومن خلال الفك النقاط [1 ، 17].


فهم نسبة العين (EAR). يمكننا تطبيق اكتشاف معالم الوجه لتحديد مناطق مهمة من الوجه ، بما في ذلك العينين والحواجب والأنف والأذنين والفم:





الشكل 2 - الكشف في الوقت الفعلي عن معالم الوجه في الصورة



وهذا يعني أيضًا أنه يمكننا استخراج هياكل وجه معينة من خلال معرفة مؤشرات معينة أجزاء من الوجه:





الشكل 3- تطبيق معالم الوجه لتحديد مناطق مختلفة من الوجه ، وهي العين اليمنى والفم



كشف وميض



من وجهة نظر اكتشاف الوميض ، نحن مهتمون فقط بمجموعتين من هياكل الوجه - العيون. يتم تمثيل كل عين بـ 6 إحداثيات (س ، ص) تبدأ من الزاوية اليسرى للعين (كما لو كنت تنظر إلى شخص ما) ثم تعمل في اتجاه عقارب الساعة حول بقية المنطقة:





الشكل 4-6 معالم الوجه المرتبطة بالعين



بناءً على في هذه الصورة ، يجب أن نلتقط عند نقطة أساسية: هناك علاقة بين عرض هذه الإحداثيات وارتفاعها. بناءً على عمل Soukupova و Cech في بحثهما لعام 2016 ، "اكتشاف وميض العين في الوقت الفعلي باستخدام معالم الوجه" ، يمكننا بعد ذلك استنباط معادلة تعكس هذه العلاقة ، تسمى نسبة أبعاد العين (EAR):





الشكل 5 - معادلة نسبة العين



حيث p1،…، p6 هي معالم ثنائية الأبعاد على الوجه. يحسب بسط هذه المعادلة المسافة بين معالم العين الرأسية ، بينما يحسب المقام المسافة بين معالم العين الأفقية ، ويوزن المقام وفقًا لذلك ، نظرًا لوجود مجموعة واحدة فقط من النقاط الأفقية ، ولكن مجموعتين من النقاط الرأسية.



حسنًا ، كما نعلم ، تكون نسبة العرض إلى الارتفاع للعين ثابتة تقريبًا عندما تكون العين مفتوحة ، ولكنها تنخفض بسرعة إلى الصفر عند حدوث الوميض. باستخدام هذه

المعادلة البسيطة ، يمكننا تجنب تقنيات معالجة الصور والاعتماد ببساطة على نسبة المسافة إلى وجهة نظر العين لتحديد ما إذا كان الشخص يومض. لتوضيح الأمر ، ضع في اعتبارك الشكل التالي:





الشكل 6 - تصور معالم العين



في الزاوية اليسرى العليا ، لدينا عين مفتوحة تمامًا - ستكون نسبة العرض إلى الارتفاع هنا كبيرة ® وثابتة نسبيًا بمرور الوقت. ومع ذلك ، بمجرد أن يومض الشخص (أعلى اليمين) ، تنخفض نسبة العرض إلى الارتفاع في العين بشكل حاد ، وتقترب من الصفر. يعرض الشكل العلوي رسمًا بيانيًا لنسبة العرض إلى الارتفاع للعين لمقطع فيديو. كما نرى ، فإن نسبة العرض إلى الارتفاع للعين ثابتة ، ثم تنخفض بسرعة لتقترب من الصفر ، ثم تزيد مرة أخرى ، مما يشير إلى وميض واحد.





الشكل 7 - اكتشاف وميض العين



استثناءات



ومع ذلك ، نظرًا للضوضاء في دفق الفيديو ، أو انخفاض اكتشاف معالم الوجه ، أو التغيرات السريعة في زاوية المشاهدة ، يمكن أن تؤدي عتبة بسيطة لنسبة العرض إلى الارتفاع للعين إلى اكتشاف إيجابي خاطئ ، مما يشير إلى حدوث وميض عندما لا يومض الموضوع بالفعل. كما قرأنا في مقال طبي ، يومض الشخص بمعدل 20 مرة في الدقيقة ، مما يخبرنا أنه يومض مرة كل 3 ثوانٍ.



بناءً على ذلك ، من أجل جعل جهاز الكشف الوامض لدينا أكثر مقاومة لهذه المشكلات ، قمنا بعمل الفاصل الزمني قبل قراءة الوميض ، ويجب أن تمر 3 ثوانٍ ، ويجب التقاط 3 إطارات على الأقل عند اكتشاف الوميض. لقد أعطت نتائج بحثنا نتائج جيدة للغاية. الكاشف يعمل بالضبط. من بين العشرين اختبارًا ، كان ثمانية عشر اختبارًا إيجابيًا.



مشاكل هذا النهج



هناك أيضًا مشاكل لم يتم حلها مع هذا النهج. إذا قمت بعرض مقطع فيديو على الكاميرا من خلال الوسائل التقنية التي تظهر وجه شخص يومض ، فقد يؤدي النظام إلى اكتشاف إيجابي خاطئ. يمكن تنفيذ حل هذه المشكلة بمساعدة درج الصورة ، حيث يمكننا باستخدام كاميرتين الحصول على خريطة عمق وحساب المسافة إلى الكائن.



حل المشاكل



هذا يدل على عمل الكاميرات الستيريو. بعد تصحيح الصور ، يتم إجراء بحث عن أزواج النقاط المقابلة من الصورتين. أبسط طريقة موضحة في الشكل 8 وهي كما يلي. لكل بكسل من الصورة اليسرى مع إحداثيات (x0 ، y0) ، يتم البحث عن بكسل في الصورة اليمنى. من المفترض أن يكون للبكسل في الصورة اليمنى إحداثيات (x0 - d، y0) ، حيث d هي قيمة تسمى التباين. يتم إجراء البحث عن البكسل المقابل من خلال حساب الحد الأقصى لوظيفة الاستجابة ، والتي يمكن أن تكون ، على سبيل المثال ، ارتباط أحياء البكسل.





الشكل 8 - حسابات خريطة العمق



All Articles