كيف تعرف الشركات أي عالم بيانات يكون أكثر برودة عند توظيفهم؟ كيف تظهر موهبتك وتصبح مشهوراً في المجتمع؟ ما هو الأساس الذي يتم على أساسه تكوين التصنيف ، والذي على أساسه يمكن أن يتم تعيينك لمنصب مرموق؟ سنخبرك عن أشهر منصة تنافسية وإمكانيات وقواعد لعبتها ، ونكشف أيضًا عن قائمة أفضل المشاركين من روسيا.

علم البيانات ، بحكم التعريف ، علم. لذلك ، من أجل تقييم المطورين والمحللين ، تم تطبيق مؤشر هيرش ، المنتشر بين العلماء ، ولا يزال قيد التطبيق لفترة طويلة . يساعد ، من خلال عدد المنشورات واستشهادها ، على فهم مقدار العمل العلمي المطلوب - ومن ثم مؤلفه.
يساوي فهرس Hirsch h عدد المقالات التي تمت الإشارة إلى كل منها على الأقل h مرة. أي ، لحسابه ، يأخذون جميع مقالات العالم التي اقتبسها زملاؤه ، ويرتبونها بترتيب تنازلي لعدد المراجع إليها ، مع تخصيص أرقام لها. بعد ذلك ، يجدون المقالة الأخيرة التي لا يتجاوز عددها عدد الاستشهادات. هذا الرقم هو مؤشر هيرش.معقد؟ يبدو أنه ليس جيدًا جدًا ، ويفهم علماء البيانات الحقيقية على الفور - ليس فقط مناسبًا جدًا لتقييم عملهم. بعد كل شيء ، تكون نتيجة عملهم في كثير من الأحيان رمزًا وليس نصًا علميًا. بالإضافة إلى ذلك ، هناك طلب على علماء البيانات في السوق ، والسوق أكثر أهمية فيما يتعلق بأمثلة الخوارزميات من الإنجازات العلمية.
لكن غالبًا ما تحتفظ الشركات بالمعلومات المتعلقة بموظفيها وعملهم في السر. يتم إخفاء علماء البيانات بعناية خاصة في روسيا ، حيث يوجد نقص كبير في الأفراد في هذا المجال.
استجابة للطلب ، نمت شعبية المنصات التنافسية للمطورين. الخدمة الأكثر شهرة هي Kaggle (تنطق: "cajel") ، وهي مملوكة لشركة Google. يستخدمه الطلاب ويقول المطورون المحترفون كيفية ترقية تقييمك. تحدد الحلول المطبقة هناك الموضة بين علماء البيانات والشركات في روسيا وفي العالم تولي اهتمامًا لمكانهم في تصنيفات Kaggle عند التوظيف.
في عام 2017 ، تم تسجيل أكثر من مليون مستخدم في Kaggle ، وفي أغسطس 2020 قام المستخدمون من روسيا بالبحث على Google عن الخدمة تقريبًا مثل عبارة "البيانات الكبيرة":
Kaggle مجاني تمامًا ، ويمكن لأي مستخدم استضافة مسابقة استخراج البيانات أو المشاركة في مسابقة موجودة. يستضيف النظام مجموعات البيانات المفتوحة ، بالإضافة إلى الأدوات السحابية للمعالجة والتعلم الآلي. هناك أيضًا فرصة للدراسة وقسم لنشر الوظائف الشاغرة ، حيث ستساعد المسابقات أيضًا في اختيار أفضل المرشحين.
كيف تعمل
واحدة من السمات المثيرة للاهتمام في Kaggle، التي بفضلها أصبح شائعا حتى في البيئة علم البيانات، و نظام التصنيف .
يمكن للمستخدمين ربح النقاط وتحسين ترتيبهم في أربع فئات مختلفة:
- منافسة. بمفردك أو كفريق واحد ، يمكنك حل مشكلات التعلم الآلي. مسابقات متنوعة جدا: من مهمة بسيطة ومباشرة من توقع عدد من الناجين على تيتانيك ل تقييم فعالية من اللاعبين الدفاع عندما لعب تمريرة من بول NFL البيانات الكبيرة 2021.
- كود البرنامج. شارك التعليمات البرمجية الخاصة بك مع المجتمع من خلال تشغيلها على Kaggle Notebooks ، وهي بيئة حوسبة سحابية.
- مجموعات البيانات. يمكنك مساعدة علماء البيانات الآخرين من خلال مشاركة بيانات جديدة.
- مناقشات. ناقش المهام وشارك أفضل الحلول لديك ، بالإضافة إلى تقييم مشاركات المستخدمين الآخرين.
الترويج في كل فئة لا يعتمد على الفئات الأخرى. تتوفر مستويات مختلفة من الإنجازات فيها:
- مبتدئ. أنت فقط بحاجة للتسجيل.
- مشارك. لقد ملأت ملفك الشخصي وتحدثت إلى المجتمع ، واستخدمت أيضًا جميع ميزات النظام الأساسي:
- تشغيل نص برمجي واحد.
- شاركنا في مسابقة واحدة.
- لقد كتبنا تعليقاً واحداً.
- أعطينا صوت واحد لأحد المشاركين.
- . Kaggle . , Kaggle .
- . , Kaggle . «» , .
- . . .
تُمنح الميداليات للحصول على نتائج ممتازة في المسابقات أو رمز البرنامج الشهير أو مجموعة البيانات المفيدة وتبقى إلى الأبد. في الوقت نفسه ، تفقد النقاط قيمتها بمرور الوقت ، مما يسمح للترتيب العام بالبقاء على صلة.
من يأتي أولا؟
الأهم من ذلك كله أن Kaggle لديها مستخدمون مسجلون من الهند والولايات المتحدة الأمريكية. يحتل الروس المرتبة الخامسة المستقرة في التصنيف العام للدول - بين الصين واليابان. المركز الأول في الترتيب العام من البيانات العلمية المسابقات التي اتخذتها Guanshuo شو، وهو عالم البيانات من نيويورك. لمدة خمس سنوات ، سجل أكثر من 255 ألف نقطة في مسابقات Kaggle (وهذا رقم قياسي مطلق). تخرج
Guanshuo حاصل على درجة البكالوريوس في الهندسة الكهربائية والإلكترونيات من جامعة تونججي في شنغهاي ، ثم التحق بدرجة الماجستير في جامعة نيو جيرسي. منذ عام 2010 ، كان يعمل على التعرف على الصور وخوارزميات التعلم الآلي ، وفي عام 2017 أصبح أول معلم كبير في Kaggle ، ومنذ عام 2019 يعمل كعالم بيانات في H2O.ai (تستخدم Cisco و Intel و PayPal خوارزميات هذه الشركة).
أفضل علماء البيانات من روسيا وفقًا لـ Kaggle
لتجميع قائمة بأفضل علماء البيانات ممارسة في روسيا ، استخدمنا بيانات المشاركين في مسابقات Kaggle ، الذين لديهم معلومات شخصية.
أقوى مطور روسي مشارك في مسابقة Kaggle يعمل أيضًا Dmitry Gordeev ( dott ) في H2O.ai. لقد سجل مع Kaggle منذ ثماني سنوات ولديه 114000 نقطة اليوم.
في الترتيب العام Kaggle ، احتل المرتبة التاسعة... تخرج ديمتري من جامعة موسكو الحكومية عام 2010 ، وقام بالتعرف على الصور واستخراج البيانات هناك. يعمل في مجموعة نمذجة مخاطر التجزئة في أحد البنوك منذ عام 2008 ، وقد نما إلى منصب مدير قسم وانتقل إلى النمسا في عام 2013. في عام 2014 ، أكمل دورة في علوم البيانات على Coursera ، وفي عام 2020 انضم إلى الفريق في H2O.ai.
في المركز الثاني بين عالم البيانات الروسي في تصنيف مسابقات Kaggle - Arthur Kuzin ( n01z3 ) - احتل المركز 28 في الترتيب العام لـ Kaggle ، حيث حصل على أكثر من 71 ألف نقطة.
تخرج آرثر من معهد موسكو للفيزياء والتكنولوجيا في عام 2011 وعمل في مجال تحليلات البحوث من عام 2008 إلى عام 2016. بعد ذلك ، حصل على وظيفة في Avito كعالم بيانات ، وعلى مدى السنوات القليلة الماضية كان يقود فريق Computer Vision في X5 Retail Group. لدى آرثر العديد من المنشورات الفيزيائية وبراءة اختراع لجهاز لمعايرة مجاهر الإرسال الإلكترونية.
المركز الثالث تؤخذ في الترتيب العام لمنافسات Kaggle بين الروس ارتيم Kulakov ( الفن) - في الترتيب العام ، حصل على المركز 29 و 71 ألف نقطة Kaggle ، والتي حصل عليها خلال عامين من المشاركة في المسابقة. يدرس أرتيم في المدرسة العليا للاقتصاد بدرجة علمية في علوم الكمبيوتر وقد عمل بالفعل كمحلل بيانات في Tinkoff Bank و Megafon. يعمل أرتيم الآن بشكل مستقل ومتخصص في مهام الرؤية الحاسوبية ومعالجة اللغات الطبيعية.
في المركز الرابع كان رومان سولوفييف ( ZFTurbo ) - لديه 69 ألف نقطة والمركز 31 في الترتيب العام لمسابقات Kaggle. رومان باحث رائد في معهد مشاكل التصميم في الإلكترونيات الدقيقة التابع لأكاديمية العلوم الروسية.
في المركز الخامس يأتي ايليا لارتشينكو ( ilialar) ، تحتل حاليًا المرتبة 37 في تصنيفات Kaggle الإجمالية برصيد 65 ألف نقطة. تخرج إيليا من معهد موسكو للفيزياء والتكنولوجيا في عام 2014 ، ثم عمل كمحلل ومطور. منذ عام 2017 ، قاد فريق عالم البيانات في DOC + ، وانتقل في عام 2020 إلى تايلاند ، حيث يعمل مديرًا لعلوم البيانات في Agoda.
أدى عنصر صغير من التحفيز يسمح للمستخدمين بربح النقاط والميداليات في مسابقات Kaggle إلى تغيير لعبة التوظيف.
يوضح مثال أفضل علماء البيانات من روسيا أن التعليم والخبرة في العمل مع البيانات ليسا مهمين للغاية لبناء حياة مهنية ناجحة. على سبيل المثال ، لا يزال Artem Kulakov يدرس في الجامعة ، وقد بدأ المشاركة في المسابقات في Kaggle قبل عامين فقط. وهو الآن مدرج في قائمة أفضل علماء البيانات في روسيا ويعمل بالقطعة. تخرج Guangshuo Xu بدرجة البكالوريوس في الهندسة الكهربائية والإلكترونية ويعمل الآن في H2O.ai ، الشركة الرائدة في حلول علوم البيانات مفتوحة المصدر.
ابدأ بمهام بسيطة اليوم - ومن يدري ، ربما في غضون عام أو عامين ، ستكون في ترتيب أفضل علماء البيانات والمضي قدمًا ، وتنفيذ تقنيات أبحاث فيروس نقص المناعة البشرية ، ونماذج للتنبؤ بازدحام الطرق السريعة وأكثر بكثير. الشيء الرئيسي هو أن تكون لديك الرغبة في التطور في مجال علوم البيانات والممارسة قدر الإمكان.

المزيد من الدورات
مقالات مقترحة
- كم يكسب عالم البيانات: نظرة عامة على الرواتب والوظائف في عام 2020
- كم يكسب محلل البيانات: نظرة عامة على الرواتب والوظائف في عام 2020
- كيف تصبح عالم بيانات بدون دورات عبر الإنترنت
- 450 دورة مجانية من Ivy League
- كيف تتعلم التعلم الآلي 5 أيام في الأسبوع لمدة 9 أشهر متتالية
- التعلم الآلي ورؤية الكمبيوتر في صناعة التعدين