مجموعة مختارة من المقالات حول التعلم الآلي: الحالات والأدلة والبحوث - يوليو 2020
يبدو أنه لم يكتمل أي من ملخصاتنا دون ذكر تطورات Open AI: في يوليو ، أصبحت خوارزمية GPT-3 الجديدة الموضوع الأكثر مناقشة في مجال التعلم الآلي. من الناحية الفنية ، هذا ليس نموذجًا واحدًا ، ولكنه عائلة كاملة ، والتي من أجل الراحة يتم تعميمها تحت اسم واحد. يستخدم أكبر نموذج 175 مليار معلمة ، وتم استخدام مجموعة بيانات 570 جيجا بايت للتدريب ، والتي تضمنت بيانات تمت تصفيتها من أرشيفات الزحف المشتركة وبيانات عالية الجودة من WebText2 و Books1 و Books2 و Wikipedia.
تجدر الإشارة هنا إلى أن النموذج مدرب مسبقًا ولا يتطلب ضبطًا دقيقًا لمهام محددة: لتحقيق أفضل النتائج ، يوصى بتزويده بأمثلة واحدة على الأقل (لقطة واحدة) أو عدة أمثلة (لقطات قليلة) لحل المشكلات عند الإدخال ، ولكن يمكنك الاستغناء عنها لهم (صفر طلقة). لكي يولد النموذج حلاً للمشكلة ، يكفي وصف المشكلة باللغة الإنجليزية. يُعتقد عمومًا أن هذه خوارزمية لتوليد النصوص ، لكن من الواضح بالفعل أن الإمكانات أكثر ثراءً.
تم تقديم النموذج مرة أخرى في مايو ، حتى ذلك الحين أظهر Open AI أن GPT-3 المدربة على مستودعات GitHub يمكنها إنشاء كود Python بنجاح ، والآن ، بعد شهر ونصف ، تمكن المحظوظون من الوصول إلى API وأظهروا أفضل ممارساتهم. النتائج مذهلة. نحن ، كمطورين ، مهتمون بالطبع بمدى تبسيط هذه الخوارزمية لحياتنا ، وربما خلق منافسة.
يمكنك استخدام أفضل الممارسات ليس فقط في برمجة الويب ، ولكن أيضًا في التصميم. النموذج قادر على توليد بيانات JSON عن طريق وصف النص وترجمتها إلى تخطيط Figma.
ترحيل قاعدة التعليمات البرمجية الخاصة بك من لغة برمجة قديمة مثل COBOL إلى بديل حديث مثل Java أو C ++ مهمة معقدة وكثيفة الموارد تتطلب مهنيين ليكونوا بارعين في كلتا التقنيتين. في الوقت نفسه ، لا تزال اللغات القديمة مستخدمة في الحواسيب المركزية في جميع أنحاء العالم ، مما يترك المالكين في كثير من الأحيان أمام خيار صعب - إما ترجمة قاعدة الرموز يدويًا إلى لغة حديثة ، أو الاستمرار في الحفاظ على الكود القديم.
يقدر المبدعون أن النموذج يترجم بشكل صحيح أكثر من 90٪ من وظائف Java إلى C ++ ، و 74.8٪ من وظائف C ++ إلى Java ، و 68.7٪ من وظائف Java إلى Python. وهو أعلى من مؤشرات النظراء التجاريين.
أدوات تطوير ContraCode بشكل متزايد التعلم الآلي لفهم وتعديل التعليمات البرمجية التي يكتبها الإنسان. تتمثل الصعوبة الرئيسية في العمل مع الخوارزميات ذات التعليمات البرمجية في عدم وجود مجموعات بيانات مصنفة.
يقترح الباحثون في بيركلي حل هذه المشكلة باستخدام طريقة ContraCode. يعتقد المؤلفون أن البرامج التي لها نفس الوظيفة يجب أن يكون لها نفس التمثيل ، والعكس صحيح. لذلك ، يقومون بإنشاء متغيرات التعليمات البرمجية للتعلم التفاعلي. لإنشاء البيانات ، يتم إعادة تسمية المتغيرات ، وإعادة تنسيق الكود وتشويشها.
في المستقبل ، سيكون نموذج التعلم الذاتي باستخدام هذه الطريقة قادرًا على التنبؤ بالأنواع واكتشاف الأخطاء وتلخيص الكود وما إلى ذلك. بالنظر إلى هذه التطورات وغيرها في هذا المجال ، من الممكن أن تتعلم الآلات قريبًا كتابة التعليمات البرمجية تمامًا مثل البشر.
أظهر مؤلفو هذه الدراسة أن شبكة الخصومة التوليدية على صورة هدف واحدة قادرة على التعامل مع التلاعبات المعقدة.
يتعلم النموذج مطابقة التمثيل البدائي للصورة (على سبيل المثال ، حواف الكائنات الموجودة في الصورة فقط) مع الصورة نفسها. أثناء التلاعب ، يسمح لك المولد بتعديل الصور عن طريق تغيير تمثيلها البدائي عند الإدخال وتعيينها عبر الشبكة. هذا النهج يحل مشكلة DNN التي تتطلب مجموعة بيانات تدريب ضخمة. كانت النتائج مبهرة.
طريقة أخرى لتحويل الصور ثنائية الأبعاد RGB-D إلى صور ثلاثية الأبعاد. تعيد الخوارزمية إنشاء المساحات المخفية بواسطة الكائنات في الصورة الأصلية. تم استخدام صورة ذات عمق متعدد الطبقات كتمثيل أساسي ، حيث يقوم النموذج بشكل متكرر بتجميع بيانات اللون والعمق الجديدة للمنطقة غير المرئية ، مع مراعاة السياق. الناتج عبارة عن صور ، يمكنك إضافة تأثير اختلاف المنظر إليها باستخدام محركات الرسومات القياسية. يتوفر كولاب حيث يمكنك اختبار النموذج بنفسك.
قدم فريق من الباحثين الروس خوارزمية مفتوحة المصدر تغير الوقت من اليوم في الصور. تعد نمذجة تغييرات الإضاءة في الصور عالية الدقة أمرًا صعبًا. تجمع الخوارزمية المقدمة بين نموذج الصورة إلى الصورة التوليدي ونظام الاختزال ، والذي يسمح بالتحويلات على الصور عالية الدقة. من المهم ملاحظة أن النموذج تم تدريبه على صور ثابتة لمناظر طبيعية مختلفة بدون طوابع زمنية.
إذا كان HiDT قادرًا على تغيير الإضاءة نوعياً في الصور ، فإن هذه الشبكة العصبية ، المدربة على مجموعات بيانات مختلفة ، قادرة على تغيير ليس فقط الوقت من اليوم ، ولكن أيضًا المشهد. لسوء الحظ ، لا توجد فرصة لرؤية الكود المصدري ، لذلك يمكننا فقط الإعجاب بالفيديو الذي يوضح قدرات هذا النموذج.
شبكة عصبية مفتوحة المصدر تجمع الصور بشكل مستقل في مجموعات ذات معنى لغويًا. والجديد في نهج المؤلف هو الفصل بين مراحل التدريب والتكتل. أولاً ، تبدأ مهمة التدريس ، ثم يعتمد النموذج على البيانات التي تم الحصول عليها في المرحلة الأولى أثناء التجميع. هذا يسمح لنتائج أفضل من النماذج الأخرى المماثلة.
يتطور توليد الشبكات العصبية بسرعة ، ويعد RetrieveGAN تأكيدًا آخر على ذلك. تستخدم الخوارزمية القائمة على الوصف النصي للمشهد أجزاء من الصور الموجودة لإنشاء صور جديدة فريدة. في حين أن الصور الناتجة تحتوي على الكثير من القطع الأثرية ، ولا تبدو قابلة للتصديق بشكل كبير ، إلا أن هذا قد يفتح في المستقبل إمكانيات جديدة في مجال التركيب الضوئي.
بفضل التقدم في رؤية الكمبيوتر والتعلم الآلي ، أصبح التتبع البشري أكثر فعالية. قامت مجموعة من الباحثين من شنغهاي بتكليف من مطور كبير بتطوير نظام للتحكم الاجتماعي في السلوك في المصاعد في الوقت الفعلي. النظام قادر على كشف النشاط المشبوه في المصاعد. وبالتالي ، يأمل المبدعون في منع التخريب والتحرش الجنسي وتهريب المخدرات. سيلاحظ النظام أيضًا ما إذا كان الناس يتوقفون في طابق معين في كثير من الأحيان: على سبيل المثال ، كان من الممكن بالفعل تحديد المطاعم التي تعمل بشكل غير قانوني في الشقة. تم بالفعل تثبيت النظام ويراقب مئات الآلاف من المصاعد.
هكذا كان شهر يوليو عنيفًا. دعونا نرى ما هي الأخبار التي تجلب لنا الشهر المقبل. شكرآ لك على أهتمامك!