كيف سأدرس علم البيانات إذا بدأت قبل عامين ، أو دليل لتعلم علوم البيانات بشكل فعال

عندما بدأت رحلتي في علم البيانات لأول مرة ، قضيت الكثير من الوقت في معرفة من أين أبدأ ، وما الذي يجب أن أتعلمه أولاً ، وما هي الموارد التي يجب أن أستخدمها. على مدار العامين الماضيين ، تعلمت بعض الأشياء التي كنت أرغب في معرفتها من قبل ، مثل التركيز على البرمجة أو الإحصاء أولاً ، وما هي الموارد التي يجب أن أستخدمها لتعلم مهارات جديدة ، وكيف يمكنني التعامل مع تعلم تلك المهارات ، وما إلى ذلك. وبالتالي ، تمت كتابة هذه المقالة لتقديم التوجيهات والأفكار لأولئك الذين يدرسون علوم البيانات .








جدول المحتويات:



مقدمة

1. الرياضيات والإحصاء

2. أساسيات البرمجة

3. الخوارزميات ومفاهيم التعلم الآلي

4. مشاريع في مجال علم البيانات



المقدمة



أعتقد أنه بصفتك عالم بيانات ناشئًا ، فأنت تريد أن تفهم تمامًا مفاهيم وتفاصيل خوارزميات التعلم الآلي المختلفة ومفاهيم علوم البيانات وما إلى ذلك.

لذلك ، أوصي بأن تبدأ بالقاعدة قبل أن تنظر حتى إلى خوارزميات التعلم الآلي أو تطبيقات تحليل البيانات. إذا لم يكن لديك فهم أساسي لحساب التفاضل والتكامل والجبر الخطي والإحصاء ، فستجد صعوبة في فهم الآليات التي تقوم عليها الخوارزميات المختلفة. وبالمثل ، إذا لم يكن لديك فهم أساسي لبايثون ، فسيكون من الصعب عليك ترجمة معرفتك إلى تطبيقات واقعية. فيما يلي ترتيب الموضوعات التي أوصي بدراستها:



  1. الرياضيات والإحصاء.

  2. أساسيات البرمجة.

  3. مفاهيم وخوارزميات التعلم الآلي.






1. الرياضيات والإحصاء



كما هو الحال مع كل شيء آخر ، يجب أن تتعلم الأساسيات قبل الدخول في الأشياء الممتعة. صدقني ، سيكون الأمر أسهل بالنسبة لي إذا بدأت بتعلم الرياضيات والإحصاءات قبل البدء في بعض خوارزميات التعلم الآلي. ثلاثة موضوعات عامة أوصي بالنظر إليها هي حساب التفاضل والتكامل ، والإحصاء ، والجبر الخطي (بدون ترتيب معين).



تكاملات



التكاملات مهمة عندما يتعلق الأمر بتوزيع الاحتمالات واختبار الفرضيات. على الرغم من أنك لست بحاجة إلى أن تكون خبيرًا ، فمن مصلحتك أن تتعلم أساسيات التكاملات. أول مقالتين مخصصتين لأولئك الذين يريدون الحصول على فكرة عن ماهية التكاملات ، أو لأولئك الذين يحتاجون فقط إلى تحسين معرفتهم. إذا كنت لا تعرف شيئًا على الإطلاق عن التكاملات ، فأوصيك بالحصول على دورة أكاديمية خان. أخيرًا ، إليك روابط لعدد من المهام العملية لصقل مهاراتك:





الإحصاء



إذا كان هناك أي موضوع يجب التركيز عليه ، فهو الإحصائيات. بعد كل شيء ، عالم البيانات هو إحصائي حديث حقًا ، والتعلم الآلي هو مصطلح حديث للإحصاء. إذا كان لديك متسع من الوقت ، فإنني أوصيك بأخذ دورة Georgia Tech بعنوان التقنيات الإحصائية ، والتي تغطي أساسيات الاحتمالات والمتغيرات العشوائية وتوزيع الاحتمالات واختبار الفرضيات والمزيد. إذا لم يكن لديك الوقت لتكريس نفسك لهذه الدورة ، فإنني أوصي بشدة بمشاهدة مقاطع فيديو أكاديمية خان حول الإحصائيات .



الجبر الخطي



الجبر الخطي مهم بشكل خاص إذا كنت ترغب في الغوص في التعلم العميق ، ولكن حتى ذلك الحين من المفيد معرفة مفاهيم التعلم الآلي الأساسية الأخرى مثل تحليل المكونات الرئيسية وأنظمة التوصية. لإتقان الجبر الخطي ، أوصي أيضًا بـ Khan Academy !




2. أساسيات البرمجة



كما أن الفهم الأساسي للرياضيات والإحصاءات مهم ، فإن الفهم الأساسي للبرمجة سيجعل حياتك أسهل كثيرًا ، خاصة عندما يتعلق الأمر بالتنفيذ. لذلك ، أوصي بأن تأخذ الوقت الكافي لتعلم اللغات الأساسية - SQL و Python ، قبل الغوص في خوارزميات التعلم الآلي.



SQL



لا يهم من أين أبدأ ، لكنني سأبدأ بـ SQL. لماذا ا؟ من الأسهل التعلم والمفيد معرفة ما إذا كنت موظفًا في شركة بيانات ، حتى لو لم تكن عالم بيانات.



إذا كنت مستخدمًا جديدًا لـ SQL ، فإنني أوصي بالاطلاع على دروس SQL الخاصة بالوضع ، لأنها موجزة للغاية ومفصلة. إذا كنت تريد معرفة المزيد من المفاهيم المتقدمة ، فراجع قائمة الموارد حيث يمكنك تعلم SQL المتقدمة .



فيما يلي بعض الموارد التي يمكنك استخدامها لممارسة SQL:





بايثون



لقد بدأت مع Python ومن المحتمل أن أبقى مع هذه اللغة لبقية حياتي. إنه متقدم كثيرًا من حيث مساهمات المصدر المفتوح ويسهل تعلمه. لا تتردد في اللجوء إلى R إذا كنت ترغب في ذلك ، ولكن ليس لدي أي آراء أو نصائح حول R. لقد وجدت أن تعلم Python بالممارسة مفيد أكثر. ومع ذلك ، بعد أخذ العديد من الدورات التدريبية المكثفة في بايثون ، توصلت إلى استنتاج مفاده أن هذه الدورة هي الأكثر اكتمالاً (ومجانية!).





الباندا



لعل أهم مكتبة يجب معرفتها هي Pandas ، وهي مصممة خصيصًا لمعالجة البيانات وتحليلها. يوجد أدناه مصدران من المفترض أن يؤديا إلى تسريع منحنى التعلم الخاص بك. الرابط الأول عبارة عن برنامج تعليمي حول كيفية استخدام Randas ، ويحتوي الرابط الثاني على العديد من المهام العملية التي يمكنك حلها لترسيخ معرفتك!








3. خوارزميات ومفاهيم التعلم الآلي



إذا كنت قد وصلت إلى هذا الجزء من المقالة ، فهذا يعني أنك قمت ببناء مؤسستك ومستعد لتعلم أشياء مثيرة للاهتمام. ينقسم هذا الجزء إلى قسمين آخرين: خوارزميات التعلم الآلي ومفاهيم التعلم الآلي.



خوارزميات التعلم الآلي



الخطوة التالية هي تعلم خوارزميات التعلم الآلي المختلفة ، وكيف تعمل ومتى يتم استخدامها. فيما يلي قائمة جزئية لمختلف خوارزميات التعلم الآلي والموارد التي يمكنك استخدامها لتعلم كل منها.





مفاهيم التعلم الآلي



بالإضافة إلى ذلك ، هناك بعض المفاهيم الأساسية للتعلم الآلي التي سوف ترغب في تعلمها أيضًا. فيما يلي قائمة (غير شاملة) بالمفاهيم التي أوصي بشدة بتعلمها. تستند العديد من أسئلة المقابلة على هذه المواضيع!








4. المشاريع في مجال علم البيانات



عند هذه النقطة ، لن تكون قد بنيت أساسًا متينًا فحسب ، بل سيكون لديك أيضًا فهم قوي لأساسيات التعلم الآلي. حان الوقت الآن للعمل في بعض المشاريع الجانبية الشخصية. إذا كنت تريد رؤية بعض الأمثلة البسيطة لمشاريع علوم البيانات ، فراجع بعض مشروعاتي:



  • توقع جودة النبيذ باستخدام طرق التصنيف ( مقالة ، جيثب ).
  • تصور بيانات فيروس كورونا باستخدام Plotly ( مقال ، جيثب ).
  • نظام توصيات الأفلام مع المرشحات التعاونية ( جيثب ).


فيما يلي قائمة بمشاريع علوم البيانات التي يمكنك الاطلاع عليها للتوصل إلى مشروع جانبي مثير للاهتمام.



آمل أن يمنحك هذا المنشور التوجيه والمساعدة في حياتك المهنية في علوم البيانات. لا يوجد حل سحري ، لذلك لا تتردد في أخذ هذا المنشور بحذر ، لكنني أعتقد أن تعلم الأساسيات سيؤتي ثماره في المستقبل. وسيضيف الرمز الترويجي HABR 10٪ إلى خصم التدريب الموضح على اللافتة.



صورة









All Articles