لتلقي المكالمات ، استخدمنا منصة Voximplant ، وللتعرف على الأسئلة والأجوبة - DeepPavlov . تم إطلاق المساعد الصوتي في غضون أسبوعين ونصف ، وساعد في معالجة 5000 مكالمة. تمكنا من طرح منتج ساعد سكان تتارستان على تلقي معلومات موثوقة من السلطات ، والخروج ببساطة إلى الشارع. أدناه سوف نخبرك كيف فعلنا ذلك.
ما هي المهمة
خططنا في الأصل لإنشاء مساعد صوتي من شأنه أن يساعد الأشخاص في تلقي الخدمات الحكومية والإجابة على الأسئلة المتداولة. ولكن عندما بدأت الحيلة الكاملة مع فيروس كورونا ، أدركنا أن ليليا ستساعد في تفريغ مركز الاتصال: على سبيل المثال ، تقديم المشورة بشأن الخط الساخن ، والمساعدة في الحصول على تصاريح رقمية وإعانات البطالة. يمكن العثور على كل ما يمكن لأي شخص اكتشافه على الموقع الإلكتروني للخدمات الحكومية من Lilia ، ويمكنك أيضًا الدردشة معها فقط.
. 1 -: , . : , , , . 12.
. , . , . , , , — « ».
بالإضافة إلى إصدار التصاريح الرقمية ، كان على ليليا الإجابة على أسئلة سكان تتارستان. ابتكرنا مساعدًا صوتيًا يجيب على الأسئلة الشائعة مثل "ما عليك القيام به للحصول على تصريح" و "هل يساعد الزنجبيل في مكافحة فيروس كورونا؟"
لحل هذه المشكلة ، يمكننا عمل IVR منتظم. لكن الرد الصوتي التفاعلي يستغرق وقتًا طويلاً ، وإذا كنت تفعل ذلك بشكل طبيعي ، فأنت بحاجة إلى وضع بنية معقدة. بشكل عام ، لم يكن هناك وقت لهذا. اعتقدنا أنه سيكون من الأسهل إنشاء مساعد صوتي (يمكنه ترجمة الكلام إلى نص ومعالجته وتصنيف المقاصد وتقديم استجابة صوتية). هيهي.
كيف تبدو من وجهة نظر المستخدم
كل شيء بسيط هنا.
- يتصل الرجل بالخط الساخن ، ويُعرض عليه الاختيار بين محادثة مع عامل الهاتف وليليا. في أي مرحلة ، يمكنك التبديل إلى عامل مباشر.
- .
- , . , -.
لتلقي المكالمات وتنفيذ البرامج النصية ، استخدمنا منصة Voximplant: كتبنا نصًا وربطنا إشارة جهاز الرد على المكالمات. استقبلت ليلي الرجل وسألته عما يريد.
يسأل المتصل سؤالاً عبر الهاتف. ثم بدأت ليليا في الاستماع. في VoxImplant ، استخدمنا وحدة ASR لترجمة الكلام إلى نص ، وهي تسمى نموذج Yandex.SpeechKit تحت الغطاء. وبالتالي ، يتم ترجمة دفق الصوت إلى نص ، والذي يخضع بعد ذلك للترميز والاشتقاق. حاولنا أيضًا استخراج الميزات: NER و POS و Chunk لطرق ML الأساسية ، لكن كل هذا استغرق وقتًا طويلاً جدًا.
على سبيل المثال ، في البداية ، من السؤال "من فضلك أخبرني كيف تحمي نفسك من فيروس كورونا" ، نشتق "الحماية" و "الفيروس التاجي" ونحولهما إلى تمثيل متجه. يتم تضمين تمثيل المتجه للكيانات في مصنف فيروس كورونا (ولاحقًا - للخدمات العامة). الآن يقوم DeepPavlov بكل هذا.
ثم هناك عدة خيارات حسب مستوى الثقة (الثقة):
- إذا صنفت الشبكة السؤال بثقة كافية (بناءً على الدراسة ، تم اختيار العتبات بشكل فردي ، حسب الفصل) ، فستجيب ليليا على السؤال.
- إذا كانت استجابة الشبكة منخفضة الثقة ، فإننا نفترض أن هذا سؤال لم نقم بتغطيته في مجموعة البيانات الخاصة بنا (لكن السؤال لا يزال يشير إلى مجال فيروس كورونا) أو أن الشخص يريد فقط التحدث عن موضوع آخر. على سبيل المثال ، سأل "من هو إيلون ماسك".
لمثل هذه الأسئلة ، استخدمنا نموذج BERT المدرب على تفريغ Wikipedia لسؤال قاعدة المعرفة الذي يجيب على المشكلة.
في النهاية ، تتحقق ليليا بالضرورة من صحة الاعتراف بالنوايا وجودة الإجابة ، متسائلاً: "هل أجبت على سؤالك؟" إذا أجاب المستخدم بنعم ، فستنتظر ليليا السؤال التالي. إذا لم يكن الأمر كذلك ، فسنطلب منك إعادة صياغة السؤال ومتابعة الدورة بأكملها مرة أخرى. يحدث أن هذا لا يعمل. ثم يدخل المشغلون المباشرون المعركة.
الآن تتحدث ليليا بصوت لطيف لمُركب الكلام من Yandex - قمنا بتغيير المفتاح قليلاً وزدنا السرعة. أحيانًا يخلط ليلي بين اللهجة ، ولكن يمكن إصلاح ذلك بالترميز. بالطبع أود أن أضيف تتار ، لكن الأمر صعب حتى الآن.
في المجمل ، استغرق المشروع أسبوعين ونصف ، مع مراعاة مجموعات البيانات: ظهرت فكرة ، ناقشنا المشروع مع الوزير ، وكما نقول ، الطحالب. قضينا أسبوعًا في التقدير والبحث ، واستغرق التطوير 10 أيام أخرى ، ثم انتهينا من وظائف إضافية وفشلناها. كانت الخيول الرئيسية هي Nvidia RTX2070. تتطلب BERTs حوالي 12-16 جيجا بايت من ذاكرة الفيديو.
من LSVM و catboost إلى DeepPavlov
أثناء عملية التطوير ، استخدمنا نماذج مختلفة من المصنفات. أولاً ، جربنا نماذج التعلم الآلي مثل Random Forest و LSVM و catboost و logreg. بشكل عام ، لم تكن دقة نماذج التعلم الآلي عالية جدًا. لماذا هذا؟ نظرًا لأن العديد من أسئلة المستخدم متشابهة جدًا مع بعضها البعض: فإن السؤال "أصيب طفلي بفيروس كورونا ما يجب فعله" مشابه تمامًا للسؤال "هل من الممكن المشي مع الطفل أثناء فيروس كورونا" ، على الرغم من أن هذه فئات مختلفة والمطلوبة إجابات مختلفة.
يمكننا القيام باستخراج الكيانات وأخذ العينات والبحث. لكننا كنا في عجلة من أمرنا. لذلك ، قررنا استخدام مكتبة DeepPavlov من MIPT في عملنا ، والتي أعطت دقة 78٪ مع الانحدار اللوجستي و BERT - 84٪.
تعتمد دقة الإجابات على ترميز مجموعات البيانات. كانت لدينا قائمة من 200 سؤال يطرحها الناس على الخط الساخن ، لكن لم يتم الفصل بينهم بشكل صحيح. على سبيل المثال ، سأل الناس ما يجب فعله إذا مرض أحد أقاربهم ، وكان السؤال هو ما هي أعراض فيروس كورونا. تم الخلط بين نماذج ML.
النتائج والخطط المستقبلية
عملت ليليا لمدة أسبوعين وعالجت 5000 مكالمة. خلال هذا الوقت ، سهلت Lilia إلى حد كبير عمل مشغلي الخط الساخن - لم يكن عليهم الإجابة عن الأسئلة التافهة والمتكررة. بفضل Lilia ، تلقى المستخدمون تصاريح وإجابات على الأسئلة وتحدثوا للتو. بالطبع ، كان هناك مستخدمون أقسموها وطلبوا الانتقال إلى المشغل.
تم إلغاء نظام العزل الذاتي ، ولم تعد التصاريح الرقمية صالحة ، لكن ليليا لا تزال في الرتب. تستمر في الإجابة على الأسئلة حول فيروس كورونا ، ولكن تمت إضافة القدرة الآن على الإجابة عن الأسئلة المتعلقة بالخدمات العامة.
نحن وزارة ، وفي الواقع ، لدينا مهمتان: بحيث تستخدم الإدارات الأخرى التقنيات بشكل طبيعي وحتى يتمكن سكان تتارستان من التواصل بسهولة وببساطة مع الدولة. يتم التعامل مع المهمة الثانية بشكل مثالي من خلال بوابة خدمات الدولة - خدماتنا المحلية ، وليس الفيدرالية. لكن هذه البوابة هي موقع وتطبيق ، ولا يزال من الصعب على البعض الوصول إليها. وإذا لم يذهب المقيمون إلى البوابة ، فإن البوابة ستذهب إلى المقيم ، أي أننا نتجه نحو تبسيط التفاعل مع البوابة للأشخاص الذين لا يستخدمون الإنترنت بشكل خاص.
تعمل وزارة الشؤون الرقمية في تتارستان الآن على ضمان حصول الناس على الخدمات الحكومية بالصوت وعبر الدردشة. نريد أن نصنع مساعدًا عالميًا يمكنك الاتصال به / الكتابة والحصول على إجابات لجميع الأسئلة المهمة.
حتى الآن ، تستطيع ليليا معرفة المدة التي يظل فيها مكتب التسجيل مفتوحًا ، وفي المستقبل نخطط أنها ستكون قادرة على أخذ قراءات العدادات (ولكن هذا يحدث فقط عندما نقرر المشكلة المتعلقة بأمان نقل هذه البيانات). بشكل عام ، نقوم بتحويل Lilia إلى منتج منفصل.
إذا كنت مهتمًا بتدريس ليليا ، فمرحباً بك في فريقنا.