التعلم العميق: كيف يعمل؟ الجزء 1

في هذه المقالة سوف تتعلم





- ما هو جوهر التعلم العميق - ما هي



وظائف التنشيط



- ما هو FCNN



- ما المهام التي يمكن لـ FCNN حلها - ما



هي عيوب FCNN وكيفية التعامل معها




مقدمة صغيرة



هذه بداية سلسلة من المقالات حول ماهية المهام في DL ، والشبكات ، والبنى ، ومبادئ العمل ، وكيف يتم حل مهام معينة ، ولماذا تكون إحداها أفضل من الأخرى.



ما هي المهارات الأولية اللازمة لفهم كل شيء؟ من الصعب قول ذلك ، ولكن إذا كنت تعرف كيفية استخدام google أو طرح الأسئلة بشكل صحيح ، فأنا متأكد من أن سلسلة مقالاتي ستساعدك على فهم الكثير.



ما الهدف من التعلم العميق؟



خلاصة القول هي بناء بعض الخوارزمية التي من شأنها أن تأخذ X كمدخلات وتتوقع Y. إذا كتبنا خوارزمية إقليدس لإيجاد GCD ، فإننا نكتب الدورات والظروف والتخصيصات وهذا كل شيء - نحن نعرف كيفية بناء مثل هذه الخوارزمية. وكيف نبني خوارزمية تأخذ صورة كمدخلات وتقول كلب أو قطة؟ أو لا شيء على الإطلاق؟ والخوارزمية ، عند إدخالها نرسل النص ونريد أن نعرف - ما هو النوع؟ من السهل جدًا كتابة دورات وشروط باستخدام الأقلام - وهنا تأتي الشبكات العصبية والتعلم العميق وكل هذه الكلمات الطنانة للإنقاذ.



أكثر رسمية والقليل عن وظائف التنشيط



من الناحية الرسمية ، نريد إنشاء وظيفة من وظيفة من دالة ... من معلمة الإدخال X وأوزان شبكتنا W ، والتي ستعطينا بعض النتائج. من المهم أن نلاحظ هنا أنه لا يمكننا فقط أخذ العديد من الوظائف الخطية ، منذ ذلك الحين تراكب الدوال الخطية - دالة خطية. ثم أي شبكة عميقة تكون مماثلة لشبكة ذات طبقتين (المدخلات والمخرجات). لماذا نحتاج اللاخطية؟ قد تعتمد معلماتنا ، التي نريد أن نتعلم كيفية التنبؤ بها ، بشكل غير خطي على بيانات الإدخال. يتم تحقيق اللاخطية باستخدام وظائف تنشيط مختلفة في كل طبقة.



شبكات عصبية متصلة بالكامل (FCNN)



مجرد شبكة عصبية متصلة بالكامل. يبدو شيئًا من هذا القبيل:



صورة



خلاصة القول هي أن كل خلية عصبية في طبقة واحدة متصلة بكل خلية عصبية في الطبقة التالية والسابقة (إن وجدت).



الطبقة الأولى هي المدخل. على سبيل المثال ، إذا أردنا تغذية صورة 256 × 256 × 3 لإدخال مثل هذه الشبكة ، فإننا نحتاج بالضبط إلى 256 × 256 × 3 خلية عصبية في طبقة الإدخال (كل خلية عصبية ستتلقى مكونًا واحدًا (R ، G أو B) من البكسل). إذا أردنا إظهار ارتفاع الشخص ووزنه و 23 ميزة أخرى ، فإننا نحتاج إلى 25 خلية عصبية في طبقة الإدخال. عدد الخلايا العصبية في المخرجات - عدد الميزات التي نريد توقعها. يمكن أن تكون إما ميزة واحدة أو 100 كلها. بشكل عام ، من خلال طبقة الإخراج للشبكة ، يمكنك بالتأكيد تحديد المشكلة التي تحلها.



كل اتصال بين الخلايا العصبية هو وزن يتم تدريبه بواسطة خوارزمية الانتشار العكسي ، والتي كتبت عنها هنا .



ما المهام التي يمكن لـ FCNN حلها؟



- مشكلة الانحدار . على سبيل المثال ، توقع قيمة متجر بناءً على بعض معايير الإدخال مثل الدولة والمدينة والشارع وحركة المرور وما إلى ذلك.



- مشكلة التصنيف . على سبيل المثال ، الكلاسيكية هي تصنيف MNIST.



- لن أتعهد بالحديث عن مهمة التجزئة والكشف عن الكائنات باستخدام FCNN. ربما سيشارك شخص ما في التعليقات :)



عيوب FCNN



  1. لا تحتوي الخلايا العصبية في طبقة واحدة على معلومات "مشتركة" (جميع الأوزان في الشبكة فريدة).
  2. عدد كبير من المعلمات المدربة (الأوزان) ، إذا أردنا تدريب الشبكة بالصور.


ماذا تفعل حيال هذه العيوب؟ الشبكات العصبية التلافيفية (CNN) بخير. ستكون هذه مقالتي التالية.



خاتمة



لا أرى فائدة كبيرة في الخوض في الشبكات العصبية المتصلة بالكامل لفترة طويلة جدًا. إذا كان أي شخص مهتمًا بتنفيذ مثل هذه الشبكات ، فيمكنك هنا رؤية وقراءة تنفيذي.



All Articles