💑 ☮️ 👨🏽‍💻 تقنية التعرف على الوجه: قصة سرية 🥔 💠 🕵🏾

قبل ستين عامًا ، اخترع وودي بليدسو ، نجل مزارع ، تقنية تحديد الوجه. لكن الدليل على تورطه في الاكتشاف اختفى عمليا.

أعد محررو Netology ترجمة مقتبسة لمقال Wired حول هذا غير معروف لدائرة واسعة من التاريخ ، حول التطورات التي قام بها Bledsoe وفريقه ، والتي تستخدم في تقنية التعرف على الوجوه الحديثة.

لمدة ثلاثين عامًا ، كان وودي بليدسو أستاذًا في جامعة تكساس في أوستن وعمل على تطوير التفكير الآلي والذكاء الاصطناعي. وفقًا لمذكرات لانس ، نجل بليدسو ، كان الأستاذ عالماً متفائلاً متحمسًا ، في أواخر الخمسينيات من القرن الماضي ، كان يحلم بإنشاء جهاز كمبيوتر يتمتع بقدرات بشرية وقادر على إثبات نظريات رياضية معقدة ، والحفاظ على محادثة ولعب كرة الطاولة بشكل لائق.

لكن في وقت مبكر من حياته المهنية ، كان Bledsoe يبحث بجدية عن فرصة لتعليم الآلات التعرف على الوجوه - وهي قدرة بشرية لا تحظى بالتقدير ولكنها قوية. كانت هذه الدراسات الأولى حول التعرف على الوجوه (1960) ، واجتذب عمل الأستاذ اهتمام أجهزة المخابرات الأمريكية. كان مستثمرو وودي الرئيسيون على الأرجح شركات واجهة لوكالة المخابرات المركزية.

:

اليوم ، يتم استخدام التعرف على الوجه لضمان الأمان في الهواتف وأجهزة الكمبيوتر المحمولة وجوازات السفر وتطبيقات الدفع. من المتوقع أن تحدث هذه التقنية ثورة في سوق الإعلانات المستهدفة وتسريع تشخيص بعض الأمراض. في الوقت نفسه ، تتحول تقنية تحديد الوجه إلى أداة للضغط الحكومي ومراقبة الشركات.

على سبيل المثال ، بمساعدة هذه التكنولوجيا في الصين ، تتعقب الحكومة ممثلي أقلية الأويغور العرقية ، الذين تم وضع مئات الآلاف منهم في معسكرات الاعتقال السياسي. وفي الولايات المتحدة ، وفقًا لصحيفة واشنطن بوست ، تجري شرطة الهجرة والجمارك ومكتب التحقيقات الفيدرالي بحثًا رقميًا: البحث عن المشتبه بهم في قواعد البيانات الحكومية الخاصة بتراخيص القيادة - أحيانًا دون اللجوء إلى المحكمة أولاً.

في عام 2019 ، كشف تحقيق أجرته فاينانشال تايمز أن باحثين من Microsoft وجامعة ستانفورد جمعوا وأتاحوا للجمهور عددًا كبيرًا من حزم البيانات الخاصة بصور الأشخاص دون معرفة أو موافقة المصور. في وقت لاحق ، تم تدمير هذه البيانات ، لكن الباحثين في الشركات الناشئة في مجال التكنولوجيا وأكاديمية عسكرية صينية تمكنوا من الحصول عليها.

توقعت أبحاث وودي بليدسو حول التعرف على الوجه في الستينيات من القرن الماضي الاختراقات التكنولوجية والجوانب الأخلاقية التي نراها اليوم. ومع ذلك ، فإن هذه الأعمال التأسيسية غير معروفة تمامًا - معظمها لم يُنشر على الإطلاق.

في عام 1995 ، ولأسباب غير معروفة ، طلب وودي من ابنه تدمير أرشيف البحث. لكن معظم الأوراق نجت ، وأصبحت آلاف الصفحات من عمله محفوظة الآن في مركز بريسكو للتاريخ الأمريكي بجامعة تكساس.

من بين أمور أخرى ، نجت العشرات من صور الأشخاص ، وتم تمييز بعض الوجوه بعلامات رياضية غريبة ، كما لو كانت مصابة بنوع من مرض جلدي "هندسي". في هذه الصور ، يمكن للمرء أن يميز تاريخ ظهور التكنولوجيا ، والتي ستتطور بنشاط في العقود القادمة وتتغلغل في العديد من مجالات النشاط البشري.

كيف بدأ كل شيء. طريقة Tuple

وُلِد وودرو ويلسون (وودي) بليدسو عام 1921 لعائلة كبيرة من مزارعي المزارع من أوكلاهوما. كان الطفل العاشر في الأسرة ، وبقدر ما يتذكره ، كان دائمًا يساعد والده في الأعمال المنزلية. كان يمتلك عقلية رياضية. تخرج من المدرسة الثانوية. درس لمدة ثلاثة أشهر في جامعة أوكلاهوما ، وبعد ذلك تم تجنيد وودي في الجيش عشية الحرب العالمية الثانية.

بعد الحرب ، درس وودي الرياضيات في جامعة يوتا ثم غادر إلى بيركلي لمتابعة الدكتوراه. بعد تخرجه من الكلية ، عمل وودي في أبحاث الأسلحة النووية في شركة سانديا المملوكة للحكومة في نيو مكسيكو - جنبًا إلى جنب مع شخصيات بارزة مثل ستانيسلاف أولام ، الذي ساعد في صنع القنبلة الهيدروجينية.

في Sandia ، اتخذ Woody الخطوات الأولى في عالم الحوسبة ، وهو التزام سيستمر طوال حياته. كتبت أولاً رمز مشاريع الأسلحة النووية. وفي وقت لاحق ، أصبح وودي مهتمًا بالتعرف التلقائي على الأنماط ، وخاصة القراءة الآلية - وهي عملية تعليم نظام للتعرف على الصور غير المسماة للأحرف المكتوبة.

توصل وودي بليدسو وزميله إيبين براوننج ، وهو مخترع واسع الاطلاع ومهندس طيران وعالم فيزياء حيوية ، إلى طريقة عرفت فيما بعد باسم طريقة n-tuple.

بدأ العلماء بإسقاط رمز مطبوع - قل الحرف Q - على شبكة مستطيلة من الخلايا ، مثل ورقة مبطنة. تم تعيين رقم ثنائي لكل خلية خلية بناءً على وجود أو عدم وجود جزء من الرمز فيها: 0 - لخلية فارغة ، 1 - للخلية المعبأة. ثم تم تجميع الخلايا بشكل عشوائي في أزواج مرتبة مثل مجموعات الإحداثيات. من الناحية النظرية ، يمكن أن تتضمن المجموعات أي عدد من الخلايا ، ومن هنا جاء اسم الطريقة. ثم ، باستخدام بعض الإجراءات الرياضية ، قام النظام بتعيين قيمة فريدة لشبكة الرموز. وعندما تم العثور على رمز جديد ، تمت مقارنة شبكة هذا الرمز مع الآخرين في قاعدة البيانات حتى تم العثور على أقرب تطابق.

كان جوهر هذه الطريقة هو أنها سمحت بالتعرف على العديد من المتغيرات للعلامة نفسها: تميل معظم الأسئلة إلى الحصول على نتائج مماثلة إلى حد ما مقارنة بأسئلة أخرى. عملت العملية بشكل أفضل مع أي نمط ، وليس فقط النص. وفقًا لروبرت إس بوير ، عالم الرياضيات وصديق وودي منذ فترة طويلة ، ساعدت طريقة tuple في تحديد نطاق التعرف على الأنماط. كانت هذه إحدى الخطوات الأولى للسؤال: "كيف يمكنني برمجة آلة للقيام بما يفعله الناس؟"

في الوقت الذي كان يطور فيه أسلوب المجموعات ، كان وودي يحلم أولاً بإنشاء آلة أطلق عليها اسم "رجل الكمبيوتر".

بعد سنوات ، تذكر "الإثارة الشديدة" التي شعر بها عند صياغة مهارات الذكاء الاصطناعي:

"أردت منه قراءة الأحرف المطبوعة والنص المكتوب بخط اليد. كان بإمكاني رؤيته أو جزء منه في كاميرا صغيرة يتم توصيلها بنظاراتي ، مع سماعة أذن أسمع من خلالها ينادي أسماء أصدقائي ومعارفي عندما التقيت بهم في الشارع ... كما ترى ، يمكن لصديقي الكمبيوتر للتعرف على الوجوه ".

البحث في Panoramic Research Incorporated

في عام 1960 ، أسس وودي - مع ابن براوننج وزميل آخر من سانديا - شركة بانوراميك ريسيرش إنكوربوريتد (بانوراميك). تم إيواؤهم في البداية في مبنى صغير في بالو ألتو ، والذي لم يكن معروفًا بعد بقلب وادي السيليكون. في ذلك الوقت ، كانت معظم أجهزة الكمبيوتر - أجهزة ضخمة تخزن البيانات على بطاقات مثقبة أو أشرطة مغناطيسية - موجودة في مكاتب الشركات الكبيرة والمختبرات الحكومية. لم تستطع شركة وودي شراء جهاز كمبيوتر ، لذلك استأجر العلماء وقت الحوسبة على مثل هذه الآلة من جيرانهم ، غالبًا في وقت متأخر من الليل عندما كانت أرخص.

كان عمل Panoramic هو "اختبار الأفكار التي كنا نأمل أن تقلب العالم رأسًا على عقب".

وفقًا لنيلز وينكليس ، الكاتب والمستشار الذي شارك في العديد من مشاريع بانوراميك وشارك لاحقًا في تأسيس مجلة الحوسبة الشخصية ، "كانت مهمتهم القيام بما يجده الآخرون سخيفًا للغاية."

أصبحت اختراعات بعض الباحثين في بانوراميك معروفة على نطاق واسع. على سبيل المثال ، عملت هيلين تشان وولف ، رائدة برمجة الروبوت ، على Shakey the Robot. وفقًا لمعهد مهندسي الكهرباء والإلكترونيات ، فهو "أول روبوت في العالم يجسد الذكاء الاصطناعي."

حاولت بانوراميك دون جدوى العثور على تمويل. بذل وودي قصارى جهده لتقديم تقنية التعرف على الشخصية ، بما في ذلك تقديم الاختراع إلى Fair Life Insurance Society ومجلة McCall's. لكن العقد لم يوقع قط.

طوال فترة وجودها ، كان لدى بانوراميك راعي واحد على الأقل يمكن الاعتماد عليه لإبقائها واقفة على قدميها ، وهي وكالة الاستخبارات المركزية.

إذا كانت هناك إشارات إلى وكالة المخابرات المركزية في أوراق وودي بليدسو ، فمن المرجح أنها دمرت في عام 1995. لكن أجزاء من المواد الباقية تشير بوضوح إلى أن شركة وودي عملت مع شركات واجهة لوكالة المخابرات المركزية لسنوات عديدة. يقول نيلز وينكليس ، الذي كان صديقًا لفريق بانوراميك ، إن الشركة تم إنشاؤها على الأرجح بتمويل من الوكالة. يتذكر Winkless ، "لم يخبرني أحد بذلك بشكل مباشر ، لكنه كان كذلك."

كانت شركة Panoramic Research Incorporated واحدة من 80 منظمة تعمل في مشروع MK-Ultra ، وفقًا لموقع استفسارات قانون الوصول المجاني إلى المعلومات (FDA) Black Vault. هذا هو برنامج "السيطرة على العقل" سيء السمعة لوكالة المخابرات المركزية والذي استخدم التعذيب النفسي دون موافقة الناس. من خلال مؤسسة أبحاث العلوم الطبية الوهمية ، تم تكليف شركة بانوراميك بتنفيذ مشاريع فرعية لدراسة السموم البكتيرية والفطرية و "التحكم عن بعد في بعض أنواع الحيوانات".

يعتقد ديفيد إتش برايس ، عالم الأنثروبولوجيا بجامعة سانت مارتن ، أن وودي وزملائه تلقوا أيضًا أموالًا من جمعية دراسة علم البيئة البشرية. نيابة عن هذا المجتمع ، قدمت وكالة المخابرات المركزية منحًا للعلماء الذين يمكن لعملهم تحسين أساليب الاستجواب التي تستخدمها الوكالة ، أو العمل كغطاء لمثل هذا البحث.

لكن أهم أبحاث بانوراميك قدمت من قبل شركة وهمية أخرى ، وهي مجموعة كينج هيرلي للأبحاث (كينج هيرلي). وفقًا لسلسلة من الدعاوى القضائية المرفوعة في السبعينيات ، استخدمت وكالة المخابرات المركزية فريق البحث هذا لشراء طائرات ومروحيات لوكالة القوات الجوية السرية المعروفة باسم Air America. لبعض الوقت ، قام King-Hurley أيضًا بتمويل الأبحاث النفسية في جامعة ستانفورد.

في أوائل عام 1963 ، كان King-Hurley يقبل فقط عرضًا مختلفًا للأفكار من Woody Bledsoe. واقترح إجراء "بحث لتحديد جدوى إنشاء آلة مبسطة للتعرف على الوجوه". بالاعتماد على عمله مع براوننج على طريقة tuple ، أراد وودي تعليم النظام التعرف على 10 وجوه. أي أنه خطط لاستخدام قاعدة بيانات من 10 صور لأشخاص مختلفين ومعرفة ما إذا كان بإمكان الآلة تحديد صور جديدة لكل منهم. كتب وودي: "سيكون من الممكن قريبًا زيادة عدد الأشخاص إلى آلاف". في غضون شهر ، أعطاه King-Hurley الإذن لبدء العمل.

التجارب الأولى في مجال التعرف على الوجوه

قد يبدو تحديد عشرة أشخاص هدفًا متواضعًا إلى حد ما اليوم ، ولكن في عام 1963 كان هدفًا طموحًا بشكل لا يصدق. كانت القفزة من التعرف على الحروف المكتوبة إلى التعرف على الوجه هائلة. هذا فقط بسبب عدم وجود طريقة قياسية لرقمنة الصور الفوتوغرافية ، ولا قاعدة صور رقمية موجودة يمكن الاعتماد عليها. يمكن للباحثين المعاصرين تدريب خوارزمياتهم على ملايين الصور الشخصية المجانية ، وسيتعين على Panoramic بناء قاعدة بيانات من البداية.

كانت هناك أيضًا مشكلة أكثر خطورة: الوجوه ثلاثية الأبعاد للأشخاص ، على عكس العلامات ثنائية الأبعاد ، ليست ثابتة. قد تختلف صور الشخص نفسه في دوران الرأس وشدة الضوء وزاويته ، وكذلك اعتمادًا على العمر وتصفيفة الشعر والمزاج - في إحدى الصور قد يبدو الشخص مرتاحًا ، وفي صورة أخرى - قلق.

بالتشابه مع إيجاد قاسم مشترك في جزء معقد للغاية ، كان على الفريق أن يعدل من أجل التباين وترتيب الصور التي يقارنها.

ولن يكون من الممكن القول بثقة أن أجهزة الكمبيوتر الخاصة بهم ستتعامل مع هذه المهمة. كان CDC 1604 أحد الأجهزة الرئيسية مع 192 كيلوبايت من ذاكرة الوصول العشوائي - حوالي 21000 مرة أقل من الهاتف الذكي الحديث النموذجي.

منذ البداية ، كان وودي مدركًا تمامًا لهذه التعقيدات ، لذلك اتخذ منهج فرق تسد: فقد قسم البحث إلى أجزاء وخصصها لمتعاونين مختلفين.

تم العمل على رقمنة الصور على النحو التالي. قام الباحث بالتقاط صور فوتوغرافية بالأبيض والأسود للمشاركين في المشروع على فيلم مقاس 16 مم. ثم استخدم جهاز المسح الذي طوره براوننج لتحويل كل صورة إلى عشرات الآلاف من نقاط البيانات. يجب أن يكون لكل نقطة قيمة شدة ضوء تتراوح من 0 (أغمق) إلى 3 (أفتح) - في مكان معين في الصورة. كان هناك العديد من النقاط التي يجب معالجتها بواسطة الكمبيوتر في وقت واحد ، لذلك كتب الباحث برنامج NUBLOB ، والذي قام بتقسيم الصورة إلى عينات عشوائية الحجم وحساب قيمة فريدة لكل منها ، مثل تلك المعينة باستخدام طريقة tuple.

عمل وودي وهيلين تشان وولف وباحث آخر على إمالة الرأس. أولاً ، رسم العلماء سلسلة من الصلبان الصغيرة المرقمة على الجانب الأيسر من وجه الشخص المعني ، من أعلى الجبهة إلى الذقن. ثم قاموا بعمل صورتين ، أحدهما كان يتطلع إلى الأمام ، وفي الأخرى استدار 45 درجة. بعد تحليل موقع التقاطعات في هاتين الصورتين ، تم استقراء البيانات على صورة وجه مع دوران 15 أو 30 درجة. تم تحميل صورة بالأبيض والأسود لوجه محدد في الكمبيوتر ، وكان الإخراج صورة شخصية تدور تلقائيًا - مخيفة ومحددة ودقيقة بشكل مدهش.

كانت حلول الباحثين أصلية ، لكنها لم تكن فعالة بما يكفي. بعد ثلاثة عشر شهرًا من بدء العمل ، اعترف فريق Panoramic أنهم فشلوا في تدريب الآلة على التعرف على وجه واحد على الأقل ، ناهيك عن عشرة.

نمو الشعر وتعبيرات الوجه وعلامات الشيخوخة - يمثل هذا التحدي الثلاثي "مصدرًا هائلاً للتنوع" ، كما كتب وودي في تقريره المرحلي في مارس 1964 إلى كينج هيرلي. المهمة المحددة "تتجاوز الحالة الحالية لمجال التعرف على الأنماط وتقنيات الكمبيوتر الحديثة." في الوقت نفسه ، أوصى وودي بتمويل المزيد من الأبحاث لمحاولة إيجاد "نهج جديد تمامًا" لحل مشكلة التعرف على الوجه.

نهج "الإنسان والآلة" للتعرف على الوجوه

خلال العام التالي ، توصل وودي إلى استنتاج مفاده أن أكثر الأساليب الواعدة للتعرف الآلي على الوجوه هو الأسلوب الذي يضيق المنطقة وصولاً إلى العلاقات بين العناصر الرئيسية: العيون والأذنين والأنف والحاجبين والشفتين.

كان النظام الذي اقترحه مشابهًا لنظام عالم الجريمة الفرنسي ألفونس بيرتيلون ، الذي أنشأه في عام 1879. وصف بيرتيلون الأشخاص بناءً على 11 قياسًا جسديًا ، بما في ذلك طول الساق اليسرى والطول من الكوع إلى نهاية إصبع القدم الأوسط. كانت الفكرة أنه إذا تم إجراء قياسات كافية ، فسيكون كل شخص فريدًا. كانت الطريقة شاقة ، لكنها نجحت: بمساعدة منه في عام 1897 ، قبل وقت طويل من انتشار استخدام البصمات ، حدد الدرك الفرنسي القاتل المتسلسل جوزيف فاس.

طوال عام 1965 ، حاولت شركة Panoramic إنشاء نظام Bertillon للتعرف على الوجه آليًا بالكامل. كان الفريق يحاول تطوير برنامج يمكنه تحديد الأنف والشفاه والمزيد باستخدام المناطق الفاتحة والداكنة في الصورة. لكنهم فشلوا.

ثم تبنى وودي وولف ما أسماه نهج "الإنسان والآلة" للتعرف على الوجوه - وهي تقنية تتضمن القليل من المدخلات البشرية في المعادلة.

قام وودي بتجنيد ابنه جريجوري وصديقه للمشروع - حيث تم إعطاؤهم 122 صورة لنحو 50 شخصًا. أخذ الرجال 22 قياسًا لكل وجه ، بما في ذلك طول الأذن وعرض الفم. ثم كتب وولف برنامجًا لمعالجة البيانات.

. , : , .

كانت خطوتهم التالية ، في أواخر عام 1965 ، هي إنشاء نسخة أكبر من نفس التجربة لجعل "الإنسان" أكثر كفاءة في نظامهم البشري الآلي. بأموال King-Hurley ، قاموا بشراء جهاز RAND اللوحي ، وهو جهاز بقيمة 18000 دولار يبدو وكأنه ماسح ضوئي للصور ولكنه يعمل مثل iPad. باستخدام قلم ، رسم الباحث على جهاز لوحي وتلقى عند الإخراج صورة كمبيوتر عالية الدقة نسبيًا.

تم التقاط مجموعة جديدة من الصور من خلال الجهاز اللوحي RAND ، مع التركيز على العناصر الأساسية للوجه باستخدام القلم. كانت هذه العملية ، على الرغم من تعقيدها ، أسرع بكثير من ذي قبل: تم إدخال البيانات لحوالي 2000 صورة ، بما في ذلك صورتان على الأقل لكل وجه. تمت معالجة حوالي 40 صورة في الساعة.

حتى مع هذه العينة الأكبر ، كافح فريق وودي للتغلب على العقبات المعتادة.

لم يتم حل مشكلة الابتسامات التي "تشوه الوجه وتغير أبعاده بشكل جذري" بالإضافة إلى الشيخوخة.

عند محاولة مطابقة صورة وودي عام 1945 مع صورة عام 1965 ، ارتبك النظام. رأت القليل من الشبه بين شاب ذو ابتسامة عريضة وشعر كثيف داكن ورجل كبير في السن بتعبير كئيب وشعر رقيق.

تصوير وودي بليدسو من دراسة أجريت عام 1965. المصور: دان وينترز

كان الأمر كما لو أن عقودًا قد خلقت شخصًا مختلفًا - وبمعنى ما كان كذلك. عند هذه النقطة ، سئم وودي من البحث عن عقود جديدة لشركة Panoramic ووجد نفسه "في موقف مثير للسخرية إما بسبب كثرة العمل أو عدم كفاية العمل". قدم باستمرار أفكارًا جديدة لرعاته ، وبعضها مشكوك فيه أخلاقياً اليوم.

في مارس 1965 - قبل 50 عامًا من بدء الصين في استخدام مطابقة الوجه للتعرف على الأويغور العرقيين في مقاطعة شينجيانغ - دعا وودي وكالة مشاريع الأبحاث المتقدمة (ARPA) التابعة لوزارة الدفاع الأمريكية لدعم بانوراميك في دراسة استخدام السمات. الأشخاص لتحديد الأصل العرقي للشخص. كتب وودي: "هناك عدد كبير جدًا من الأبعاد الأنثروبولوجية للأشخاص من جميع أنحاء العالم الذين ينتمون إلى مجموعات عرقية وبيئية مختلفة". "إنه مستودع بيانات واسع وقيِّم تم جمعه بصعوبة كبيرة وتكاليف كبيرة ، ولكن لم يتم استخدامه بشكل صحيح." ما إذا كانت ARPA قد وافقت على تمويل هذا المشروع لا يزال غير معروف.

استثمر وودي آلاف الدولارات في بانوراميك من أمواله الخاصة دون أي ضمان لعودتها. في هذه الأثناء ، أقنعه أصدقاؤه من جامعة تكساس في أوستن بالحصول على وظيفة في الجامعة ، مما أغراه براتب ثابت. وفي يناير 1966 ، غادر وودي بانوراما. أغلقت الشركة بعد ذلك بوقت قصير.

بحلم إنشاء رجل كمبيوتر ، انتقل وودي مع عائلته إلى أوستن لتكريس نفسه لدراسة وتعليم التفكير الآلي. لكن عمله على تقنية التعرف على الوجه لم ينته عند هذا الحد.

أكثر تجارب وودي بليدسو نجاحًا للتعرف على الوجه

في عام 1967 ، تولى وودي مهمة نهائية تتعلق بالتعرف على أنماط الوجه. كان الغرض من التجربة هو مساعدة وكالات إنفاذ القانون على التدقيق بسرعة في قواعد بيانات الأشخاص الموقوفين بحثًا عن التطابقات.

كما في السابق ، يبدو أن تمويل المشروع جاء من حكومة الولايات المتحدة. وثيقة عام 1967 ، رفعت عنها السرية من قبل وكالة المخابرات المركزية في عام 2005 ، تشير إلى "عقد خارجي" لنظام التعرف على الوجه الذي من شأنه أن يقطع أوقات البحث مائة ضعف.

كان الشريك الرئيسي لوودي في المشروع هو بيتر هارت ، وهو مهندس أبحاث في مختبر الفيزياء التطبيقية في معهد ستانفورد للأبحاث. (يُعرف الآن باسم SRI International. وانشق المعهد عن جامعة ستانفورد في عام 1970 بسبب الاختلافات في الحرم الجامعي حول اعتماد المعهد الكبير على التمويل العسكري.)

بدأ وودي وهارت بقاعدة بيانات تضم حوالي 800 صورة - صورتان لكل منهما "400 رجل قوقازي بالغ". اختلف هؤلاء المصورون من حيث العمر ودوران الرأس. باستخدام لوحة RAND ، سجل العلماء 46 إحداثيات لكل صورة ، بما في ذلك خمس قيم لكل أذن وسبعة للأنف وأربعة لكل حاجب. بناءً على خبرة وودي السابقة في تطبيع الاختلافات في الصور ، تم استخدام معادلة رياضية لـ "قلب" الرؤوس في المنظر الأمامي. بعد ذلك ، لحساب الاختلاف في المقياس ، تم تكبير كل صورة أو تصغيرها إلى حجم قياسي ، حيث كان المقياس المرجعي هو المسافة بين التلاميذ.

كانت مهمة النظام هي حفظ نسخة واحدة من كل شخص واستخدامها للتعرف على الآخر.

عرض وودي وهارت على السيارة أحد الاختصارين. في الحالة الأولى ، المعروفة بمطابقة المجموعة ، قسّم النظام الوجه إلى ملامح - الحاجب الأيسر والأذن اليمنى وما إلى ذلك - وقارن المسافات النسبية بينهما.

المصور: دان وينترز

النهج الثاني استند إلى نظرية قرار بايزي ، حيث استخدمت الآلة 22 بعدًا لعمل تخمين تعليمي عام.

نتيجة لذلك ، تعامل كلا البرنامجين مع المهمة بشكل جيد تقريبًا. واتضح أيضًا أنه أفضل من منافسيه من البشر. عندما طلب وودي وهارت من ثلاثة أشخاص أن يطابقوا مجموعات فرعية من 100 فرد ، حتى أسرعهم استغرق ست ساعات. أكمل مركز السيطرة على الأمراض 3800 مهمة مماثلة في حوالي ثلاث دقائق ، محققًا تقليل الوقت بمقدار 100 ضعف. كان البشر أفضل في التعامل مع دوران الرأس وجودة الصور الرديئة ، لكن الكمبيوتر كان "متفوقًا بشكل كبير" في اكتشاف التغيرات المرتبطة بالعمر.

وخلص الباحثون إلى أن الآلة "تهيمن" أو "تهيمن" على الشخص. كان هذا أكبر نجاح لوودي في بحثه عن التعرف على الوجه.

كان أيضًا آخر أعماله حول هذا الموضوع ، والذي لم يُنشر أبدًا "لمصلحة الدولة" ، وهو الأمر الذي ندم عليه وودي وهارت بشدة.

في عام 1970 ، بعد عامين من انتهاء تعاونه مع هارت ، أخبر فني روبوت يدعى مايكل كاسلر وودي أن ليون هارمون من مختبرات بيل كان يخطط لدراسة التعرف على الوجه. أجاب وودي: "إنني غاضب من نشر هذا النوع الثاني من الدراسة وسيصبح في نهاية المطاف أفضل نظام إنسان وآلة. يبدو لي أنه بالعمل الجاد ، سيكون ليون متأخرًا عنا بحوالي 10 سنوات بحلول عام 1975 لا بد أن وودي أصيب بخيبة أمل عندما ظهر بحث هارمون على غلاف مجلة Scientific American بعد بضع سنوات - بينما تم الاحتفاظ بعمله الأكثر تقدمًا في المخازن.

استخدام طريقة Woody Bledsoe في تقنية التعرف على الوجوه الحديثة

في العقود التي تلت ذلك ، فاز وودي بجوائز لمساهماته في التفكير الآلي. لمدة عام ، شغل منصب رئيس جمعية تنمية الذكاء الاصطناعي. لكن عمله في التعرف على الوجه ظل إلى حد كبير غير معترف به ونسيًا تقريبًا ، بينما كان آخرون يجمعون أمجاد.

في عام 1973 ، حقق عالم الكمبيوتر الياباني تاكيو كانادي قفزة كبيرة في تقنية التعرف على الوجه.

استنادًا إلى قاعدة بيانات تضم 850 صورة رقمية من المعرض العالمي في Sweet (اليابان) في عام 1970 ، طورت كندا برنامجًا يمكنه استخراج ملامح الوجه - الأنف والفم والعينين - دون تدخل بشري. نجحت كندا في تحقيق حلم وودي باستبعاد الإنسان من نظام الإنسان والآلة.

استخدم وودي معرفته بالتعرف على الوجه عدة مرات على مر السنين.

في عام 1982 ، تم إحضاره كخبير في قضية جنائية في ولاية كاليفورنيا. اتهم عضو مزعوم في المافيا المكسيكية بارتكاب سلسلة من عمليات السطو في مقاطعة كونترا كوستا. كان لدى المدعي العام عدة أدلة ، بما في ذلك لقطات فيديو للمراقبة لرجل طويل الشعر بلحية ونظارة شمسية وقبعة شتوية. لكن في الصور ، بدا المتهم رجل حليق الذقن وشعره قصير. قاس وودي وجه السارق وقارنه بصور المتهمين ، ووجد أن الوجوه تخص شخصين مختلفين بسبب اختلاف عرض الأنف. على الرغم من حقيقة أن الرجل لا يزال في السجن ، تمت تبرئته من أربع تهم ، حيث كان وودي شاهدًا.

يقول Anil K. Jain ، عالم البرمجيات في جامعة ولاية ميتشيغان والمحرر المشارك لكتيب التعرف على الوجوه: "في السنوات العشر الماضية فقط ، تعلمت تقنية التعرف على الوجه كيفية التعامل مع العيوب".

اختفت تقريبا جميع المشاكل التي واجهها وودي. يوجد اليوم عدد لا ينضب من الصور الرقمية. تقول جين: "من خلال وسائل التواصل الاجتماعي ، يمكنك الحصول على العديد من لقطات الوجه كما تريد". وبفضل التقدم في التعلم الآلي والذاكرة وقوة المعالجة ، تتعلم أجهزة الكمبيوتر التعلم بفعالية. من خلال بعض القواعد البسيطة ، يمكنهم تحليل كميات هائلة من البيانات وإنشاء قوالب لأي شيء تقريبًا بدءًا من الوجه البشري وحتى كيس الرقائق - لا يلزم إجراء المزيد من القياسات باستخدام جهاز RAND اللوحي أو طريقة Bertillon.

حتى بالنظر إلى المدى الذي وصل إليه التعرف على الوجه منذ منتصف الستينيات ، حدد وودي بليدسو العديد من التحديات التي لا يزال يتعين معالجتها في هذا المجال.

, - . , , , .

في حين أن أنظمة التعلم العميق الحديثة لا يتم توجيهها صراحة من قبل المبرمج لتحديد الأنوف والحواجب ، فإن تحول وودي في هذا الاتجاه في عام 1965 حدد اتجاه الصناعة لعقود. يقول تاكيو كانادي ، وهو الآن أستاذ في معهد كارنيجي ميلون للروبوتات: "خلال الأربعين عامًا الأولى كان استخراج الميزات هو السائد".

اليوم ، إلى حد ما ، عادوا إلى ما يشبه المحاولات الأولى لوودي "لاكتشاف" وجه بشري ، عندما استخدم تنوعًا في طريقة الصفوف للعثور على أنماط التشابه في حقل ضخم من نقاط البيانات. على الرغم من تعقيد أنظمة التعرف على الوجوه الحديثة ، يقول أنيل جين إنهم ببساطة يقارنون أزواج الصور ويحددون لها درجة تشابه.

ولكن ربما الأهم من ذلك ، أن عمل وودي بليدسو قد حدد النغمة الأخلاقية لأبحاث التعرف على الوجه - ذات الصلة والمشكلة. على عكس التقنيات الأخرى التي غيرت العالم والتي أصبحت قدراتها الكارثية واضحة على مر السنين - وسائل التواصل الاجتماعي ويوتيوب والطائرات بدون طيار - فإن إساءة استخدام تقنية التعرف على الوجه كانت واضحة منذ لحظة ولادتها في Panoramic.

العديد من التحيزات التي يمكن أن تُعزى إلى بقايا وقت أبحاث وودي - الانجذاب إلى تجارب الأشخاص البيض فقط تقريبًا ، والثقة غير المبالية على ما يبدو في الحكومة ، والرغبة في استخدام التعرف على الوجه للتمييز على أسس عرقية - كل هذا متأصل في المجال الحديث للتعرف على الوجوه.

في اختبار عام 2019 لبرنامج Amazon's Rekognition ، تم التعرف على 28 لاعبًا من NFL عن طريق الخطأ كمجرمين. بعد أيام قليلة ، رفع الاتحاد الأمريكي للحريات المدنية دعوى قضائية أمام وزارة العدل الأمريكية ومكتب التحقيقات الفيدرالي وإدارة مكافحة المخدرات للحصول على معلومات حول استخدامهم لتقنية التعرف على الوجه من أمازون ومايكروسوفت وشركات أخرى. يقول تقرير صدر عام 2019 عن المعهد الوطني للمعايير والتكنولوجيا ، والذي اختبر كود أكثر من 50 من مطوري برامج التعرف على الوجه ، إن الرجال البيض أقل عرضة لسوء التطابق مع المجرمين من المجموعات الأخرى. في عام 2018 ، وجه اثنان من العلماء انتقادات حادة: "نعتقد أن تقنية التعرف على الوجه هي أخطر آلية مراقبة تم اختراعها على الإطلاق".

في ربيع عام 1993 ، تدهور كلام وودي بسبب المرض التنكسي لمرض التصلب الجانبي الضموري. لكنه استمر في التدريس في جامعة تكساس حتى أصبح حديثه غير مقروء. واصل بحثه في مجال التفكير الآلي - حتى توقف عن الإمساك بالقلم. أثناء بقائه عالما حتى النهاية ، قام وودي بتدوين ملاحظات عن خطابه لتتبع تطور المرض.

توفي وودي بليدسو في 4 أكتوبر 1995. لم يذكر النعي عمله في التعرف على الوجه. في صورة النعي ، كان وودي ذو الشعر الرمادي يحدق مباشرة في الكاميرا ، وابتسامة عريضة على وجهه.

تعليق بقلم إيلينا جيراسيموفا ، رئيس قسم التحليلات وعلوم البيانات في Netology

لم تكن أفكار وودي بليدسو ناجحة تجاريًا ، ربما لأن وقتهم سقط في أحد "فصول الشتاء التي تعتمد على الذكاء الاصطناعي". كان هناك القليل من الثقة في التقنيات ، ولم تكن هناك قدرة كافية لإظهار نتائج مبهرة ، وكانت تقنيات إعادة بناء الدماغ البشري منخرطة بشكل أساسي من قبل المتحمسين - الأكاديمي أندريه نيكولايفيتش كولموغوروف ، وعالم الرياضيات الأمريكي جورج تسيبينكو وآخرين.

ومع ذلك ، بفضل هذا البحث ، أصبحت الاختراقات الحديثة ممكنة ، والتي تستند إلى قوة الحوسبة القوية ، والسحب ، والرقائق الدقيقة.

في عام 1998 ، أتقن Yang LeCun مناهج التعرف على الأرقام المكتوبة بخط اليد على LeNet الخاص به - بفضل تطور قوة الحوسبة التي لم تكن متاحة أثناء بحث Woody Bledsoe.

تقترب تقنية التعرف على الوجوه من تقنية إنشاء الوجه الأكثر تقدمًا ، والتي تُستخدم ، على سبيل المثال ، لإنشاء صور مزيفة عميقة وتوليد وجوه للبالغين والأطفال ، وكذلك القطط والكلاب. يبدو أنه من الأسهل - التقاط صورة لشخص وتحميلها ، بشكل مشروط ، إلى كتالوج الملابس الإلكتروني ؛ أو تصوير فيديو لطيف مع طفل ولعب ؛ أو تعليم شبكة عصبية لتكوين صورة لطفل يرتدي ملابس أو داخلية أو بلعبة نخطط لوضعها في الكتالوج وبالتالي نعرضها؟ سيكون الدافع وراء الإجابة هو حجم الاستثمار في الشركات التي تعمل على تطوير التكنولوجيا لإنشاء صور واقعية - في الولايات المتحدة وحدها في عام 2019 ، بلغ إجمالي الاستثمار أكثر من 500 مليون دولار.

توليد الصور الواقعية للناس

إذا كنت مهتمًا بالعمل مع البيانات والشبكات العصبية ، فنحن نقدم لك التعرف على برامجنا ، والتدريب الذي يعتمد على قاعدة علمية وبحث:

المهنة " عالم بيانات ". جائزة " علامة الجودة " في ترشيح "تدريب محترفي الصناعة الرقمية" (2019).
دورة التعلم العميق . في الصفحة المقصودة للدورة التدريبية ، يمكنك رؤية أمثلة لمشاريع ضمن الدورة ومعرفة كيفية سير التدريب.

وبالنسبة لأولئك الذين يبحثون عن طرق لتنفيذ الذكاء الاصطناعي والتعلم الآلي و "إعادة التشغيل الرقمي" ، نقترح النظر في المعلومات الموجودة في الدورة التدريبية " تحول الأعمال: إدخال الذكاء الاصطناعي ". يقوم الطلاب بإنشاء استراتيجية لتنفيذ الذكاء الاصطناعي والعمل على حالات عمل حقيقية بتوجيه من الخبراء الأجانب والروس.

تقنية التعرف على الوجه: قصة سرية

: