عن فهم الذكاء الاصطناعي

يتم تمثيل الذكاء الاصطناعي الآن من خلال أنظمة مختلفة ، ولكن لا يمكن التحدث عن الفهم إلا في أنظمة الحوار الخاصة بالذكاء الاصطناعي (AI). وينخفض ​​موضوع الفهم في الذكاء الاصطناعي إلى عدة جوانب من تفاعل الحوار بين عامل اصطناعي مع شخص:



  1. تتوافق النصوص الناتجة عن نظام الحوار مع "الفطرة السليمة".
  2. تتوافق ردود النظام مع سياق الحوار وتوقعات الشخص.
  3. فهم أهداف ونوايا تصريحات الشخص في الحوار.


لا يمكن أن يُعزى فهم المعنى بالكامل إلى موضوع فهم سياق الحوار ، حيث يمكن تفسير معنى بيان المحاور بطرق مختلفة ، وليس من الواضح ما هو التفسير الذي يجب أن تتوافق معه حالة الفهم. هل يمكن تفسير "الأخطاء" في رأي المحاور (الشخص) على أنها فهم مختلف لمعنى التعبير من قبل النظام؟ إلى حد كبير ، يشير فهم المعنى إلى فهم مقاصد وأهداف البيان ، وهذا موضوع منفصل في نظرية العقل. يمكن تفسير "الفطرة السليمة" كمعيار للفهم بشكل أكثر دقة. بشكل عام ، هذا هو تطابق الإجابة مع صورة العالم ، والتي يمكن التحقق منها. واليوم هذا هو أفضل معيار لفهم سياق الحوار بواسطة وكلاء مصطنعين مثل روبوتات الحوار. لكن حتى الآن ، لم تظهر الروبوتات نجاحًا في هذا الأمر.



تحليل المناهج



الإجابة ذات الصلة هي أبسط معيار يستطيع الروبوت فهم المحاور (الشخص). لكن من السهل "تزوير" هذا المعيار ، وهو ما تم إثباته أكثر من مرة من قبل المشاركين في جائزة لوبنر. يتم تحقيق ذلك من خلال وضع عدد كبير من قوالب الاستجابة المتغيرة على "النوايا" التي تتعرف عليها الشبكة العصبية. من الصعب تسمية هذا الفهم. لكن نجاح مثل هذه الروبوتات متواضع أيضًا - فهم يتعرفون على النوايا المختلطة بشكل سيئ للغاية. سؤال واحد خارج القوالب وفشل النظام. من السهل التحقق من ذلك على روبوتات مثل Alice من Yandex و Siri من Apple. يمكننا القول أن معرفة العالم بمثل هذه الأنظمة مجزأة.



هناك طريقة أخرى تتمثل في بناء علم الوجود الذي يغطي جميع المعارف حول العالم من أجل الحصول على إجابات للأسئلة. يتم تحقيق ذلك من خلال القدرة على تحديد سؤال في فرع الأنطولوجيا وبناء الإجابة الصحيحة بناءً على المعرفة المضمنة فيه. تدعي الأنطولوجيات أنها تغطي الصورة الكاملة للعالم بعلم الوجود. تم استخدام هذا النهج من قبل مشاريع مثل CYC و ABBYY Compreno. الآن يمكننا أن نقول أن هذه الطريقة في حل مشكلة "الفهم" قد فشلت. عقود من البناء اليدوي لمثل هذه الأنطولوجيا من قبل مهندسي التطوير لم تسمح لهم ببناء حتى واحد لا يفشل حتى في أسئلة الأطفال البسيطة. ترتبط مشاكل علم الوجود بشكل أساسي بالطبيعة المجازية للغة والتماثل المتماثل ، والتي لا يمكن وضعها باستمرار في بنية "منطقية" من علم الوجود تشبه الشجرة. تتضمن المحاولات نفسها مشاريع FrameNet (فيلمور) ،تتكون من بناء سيناريوهات تستند إلى إطار دلالي يعكس حقائق العالم. لكن للأسباب نفسها ، لا يمكن تطوير المشروع.يمكن القول أن مثل هذه الأنظمة غير قادرة على إدراك شح اللغة مثل القدرة على وصف عدد كبير من المفاهيم من خلال آلية الاستعارة مع مفردات محدودة.



منذ عام 2010 ، تم التركيز بشكل أكبر على الشبكات العصبية ، لكنها محدودة من حيث أنها لا تستطيع وضع افتراضات إلا في إطار صورة العالم التي كانت موجودة في مجموعة التدريب. شبكات مثل GPT-3 (فبراير 2019) في مشروع OpenAI ، المبنية على بنية Transformer (شبكة توليد مدربة على مليارات الكلمات من حيث النص) ، تولد نصوصًا "بشرية" صحيحة نحويًا لا معنى لها تمامًا ، مما يشير إلى سوء فهم كامل من جانبهم " الفطرة السليمة "كما في المثال أدناه.



مثال:



أنت: كم عدد عيون الذئب؟

GPT-3: للذئب أربع عيون.

أنت: لماذا أربعة؟

GPT-3: اثنان للرؤية في الظلام مع.

أنت: لماذا اثنين؟

GPT-3: يحتاج الذئب إلى معرفة ما إذا كان طعامه جاهزًا.

أنت: وكم عدد عيون الإنسان؟

GPT-3: للإنسان عينان وأذنان يسمع بهما.

أنت: وكم عدد العيون التي لديها نصل من العشب؟

GPT-3: نصل من العشب له عين واحدة وأذن واحدة لترى وتسمع.

أنت: لماذا واحد؟

GPT-3: لضمان عدم التدخل.



يمكننا أن نقول أن مثل هذه الأنظمة يمكن أن تولد بيانًا حول أي سؤال ، حتى لا يوجد في النصوص التعليمية ، لكن لا يمكن ضمان بناء حقائق "منطقية" تتوافق مع صورة العالم.



هناك مناهج مشتركة مثل COMET ، التي أسسها Yejin Choi (1) ، والتي تم فيها استخدام قاعدة معرفية "مكتوبة بخط اليد" لحقائق العالم الذري لإعادة تدريب نموذج اللغة GPT-2 الذي تم تدريبه مسبقًا. ونتيجة لذلك ، بدأت الشبكة في إنتاج حقائق أكثر منطقية وغائبة في كل من مجموعة التدريب Atomic ومجموعة GPT. لكن نجاح مثل هذا المشروع متواضع أيضًا حتى الآن ، حيث لا توجد إجابة مضمونة.



من الأمور المهمة أنظمة DeepMind ، والتي ، بالإضافة إلى الشبكة العصبية ، لديها ذاكرة خارجية للحقائق (أو الخبرة) ، والتي تسمح لهم بتعلم "قواعد اللعبة" بدون معلم ، وذلك ببساطة عن طريق النشاط في البيئة وتسجيل نتيجتها. وبهذه الطريقة نتعلم ، حتى في اللعب مع بعضنا البعض ، مما جعل من الممكن التغلب على اللاعبين البشريين حتى في ألعاب مثل Go. يعتبر هذا الآن هو الاتجاه السائد في بناء العملاء الذين "يفهمون عالم" اللعبة. لكن بنية نظام التعلم الذاتي هذا لا تسمح بتحجيمه إلى واقع أكثر تعقيدًا من لعبة الحصى بالأبيض والأسود أو لعبة الكمبيوتر البدائية أتاري. من الواضح أن طريقة التدريس لها حدود تكنولوجية من التعقيد.يمكننا القول أن مثل هذه الأنظمة تخلق "صورة للعالم" وليس باستخدام المعرفة لبناء معرفة جديدة من أجل توفير موارد النظام. لذلك ، فهم بحاجة إلى الكثير من الموارد للتعلم حتى في البيئات الفقيرة.



ملخص



ما الذي يمكن أن نطلق عليه إذن "فهم" الأنظمة الاصطناعية من وجهة نظر براغماتية؟ الجواب الشائع هو أن الوكيل يجب أن يكون لديه معرفة. في الوقت نفسه ، كما تظهر التجربة ، من المستحيل بناء معرفة شاملة. قد تكون الإجابة الأخرى هي الاتساق في استجابات النظام. لكن كما نرى ، فإن الأنظمة المدربة على نصوص ضخمة لا تختلف في منطقيتها في البيانات التي تولدها.



إن الفهم من خلال نظام الذكاء الاصطناعي يعني قدرته على تقديم فرضيات معقولة حول صورة العالم من المعرفة المجزأة للحقائق من هذا العالم. ولتوفير المال ، يجب أن يكون النظام قادرًا على استخدام لغة محدودة لوصف عدد لا حصر له من الحقائق ، وهو ما يتحقق بآليات مثل الاستعارة. ومع ذلك ، في الوقت الحالي ، هذه الآلية غير معروفة بما يكفي لتتضمن في كود البرنامج. المفاهيم المتاحة للاستعارة ليست محددة حسابيًا ، مثل الاستعارة المفاهيمية أو التوليفات. الرياضيات لا تنطبق عليهم بعد ، لكن عمل المؤلف يتم في هذا الاتجاه.



وفقًا للمؤلف ، فإن هذا الإنجاز هو المعيار الرئيسي لقدرة النظام الاصطناعي على الفهم. عندما تكون "صورة العالم" محدودة ، على سبيل المثال ، في لعبة الشطرنج ، نكون قادرين بشكل صريح على وضع خوارزميات لإنتاج المعرفة ، أي الحركات المحتملة ، بحيث يمكن للشطرنج توجيه نفسه في أي ترتيب للقطع لم يتم مواجهتها من قبل. ولكن كيفية القيام بذلك في العالم الحقيقي ، حيث توجد العديد من القواعد ذات الحجم الكبير ، فليس معروفًا بعد ما الذي يشكل الاتجاه الرئيسي لبحث المؤلف.



قائمة المراجع



1. الحس السليم أقرب إلى أجهزة الكمبيوتر ، Quantamagazin ، 30 أبريل 2020



All Articles