مقدمة
مرحبا!
السؤال في العنوان ليس بلاغيًا ، أنا مهتم حقًا. إذا عرف شخص ما الإجابة عليه فجأة ، يرجى الكتابة في التعليقات ، ربما حاولت الانتقال من الجانب الخطأ.
كما أوضحت أنه ليس لدي أي هدف للشكوى من شخص ما ، لذلك ، في ردود الوزارات ، قمت بإزالة جميع الطوابع التي تحمل أسماء وتوقيعات المسؤولين. أنا مهتم بفهم كيفية عمل هذا النظام.
كيف جميعا لم تبدأ؟
بدأ كل شيء بحقيقة أنني في نهاية عام 2019 أدركت أنه في مجال نشاطي المهني السابق ، وصلت إلى ذروة معينة والمزيد من التطور في هذا المجال بالنسبة لي:
- غير مهتم
- هذا ممكن ، لكنه يتوافق تمامًا مع مبدأ باريتو حيث سأضطر إلى بذل الكثير من الجهد من أجل الآفاق الوهمية ، وحتى غير مرغوب فيه كما بدا لي في بداية الرحلة.
بفضل اجتماع مهم واحد مع الأصدقاء ، أدركت أن رغبة طويلة الأمد ، غارقة لأسباب مختلفة ، هي "الذهاب إلى تكنولوجيا المعلومات" ، وبالتحديد في ML وعلى وجه التحديد يمكنني النجاح. لن أصف كيف درست ، لكنها كانت حقاً مكثفة ومثمرة والأهم من ذلك أنها مثيرة لدرجة أنني اضطررت إلى إجبار نفسي على الراحة. في النهاية ، ذهبت لكسر. استقال من وظيفته القديمة وكرس كل وقت فراغه تقريبًا للدراسة.
بمرور الوقت ، بدأت أفكر في العثور على وظيفة في شركة مفضلة جديدة ، ولكن بعد ذلك بدأت القصة مع كوفيد. أيضًا ، ليس سراً أن التعلم الآلي أصبح مؤخرًا موضوعًا عصريًا للغاية ، ونتيجة لذلك ، ظهر عدد كبير من المتقدمين لشغل وظائف المبتدئين / المتدربين في مجال DS في سوق العمل. مجتمعة ، هذان العاملان ، بالنسبة لي شخصيًا ، يعنيان أنه حتى مع النتائج الجيدة في العديد من الكفاءات لصاحب العمل ، كنت مجرد واحد من العديد من الوافدين الجدد في هذا المجال ، مثلي تمامًا ، ولم يكن لدي فرصة تذكر حتى للوصول إلى مرحلة المقابلة.
عند التفكير وإدراك أن الشيء الوحيد الذي يمكنني تمييزه بشكل إيجابي عن الباقي هو وجود مشاريع جيدة ، بدأت في البحث عن موضوع للمشروع الأول. عندما بدأت للتو في دراسة ML ، كنت مليئًا بعدد الأفكار ، ولكن بحلول الوقت الذي اخترت فيه موضوع المشروع ، أصبحت هذه الأفكار أقل ، لأنني بعد أن تعمقت بالفعل في التفاصيل قليلاً ، بدأت أفكر بشكل مختلف قليلاً - "نعم ، هذه فكرة جيدة ، لكن افتح السيرة الذاتية مناسب بسبب تدريبه الأولي ولتعليمي ، لن أمتلك موارد وبيانات كافية ، فقط إذا لم تأخذ شبكة GAN وتنتج صورًا بمساعدتها. ثم هناك قيود على طلبات الإصدار المجاني من API ، ولتفريغ مجموعة بيانات عادية ، فإنك تحتاج إما إلى الكثير من الوقت أو المال "وما إلى ذلك.
بعد أن قررت الانتقال من الطرف الآخر ، عدت إلى Kaggle ، وفتحت مجموعات البيانات ، وصنفتها حسب "السخونة" ثم اتضح لي الأمر. كوفيد في الفناء! ما الذي يمكن أن يكون أفضل - ليس فقط إنشاء مشروع ، ولكن مشروع حول موضوع الضجيج! ثم سيلاحظونني على الأرجح ويمزقونني بأيديهم. لذلك اعتقدت بعد ذلك. نعم ، شاز.
بالنظر إلى المستقبل ، لا يسعني إلا أن أشير إلى أنه على الرغم من كل مزاياي الصغيرة ، ولكن المزايا ، فقد تم تجاهل ردودي على xx بشكل علني أو رفضها بأدب ، حتى بالنسبة لتلك الوظائف الشاغرة التي أوصى بها موظف داخلي في الشركة. في شهر واحد فقط من البحث عن وظيفة ، كان هناك حوالي 70 ردًا من جانبي ، ويبدو أنني اتخذت 3 مقابلات بعد ذلك بنفسي قرارًا سلبيًا. لا أعرف بالضبط ما كان عليه الحال في كل حالة على حدة ، لكنني أظن أن الأمر يتعلق بعمر (30+) ونقص التعليم / الخبرة المتخصصة والمشاريع الملتوية.
لكن على وجه التحديد ، قصة البحث عن وظيفة بنهاية جيدة - وجدني مديري الحالي في xx بنفسي ، ومررت بسرعة بمراحل المقابلات والآن أقوم بإجراء التحليلات ، بما في ذلك استخدام ML ، وأنا أحب ذلك حقًا. علاوة على ذلك ، يدفعون لي مقابل ذلك! ربما لن أقول هذا لوجه قائدي بسبب انطوائي المؤكد ، لكن شكراً جزيلاً إذا قرأت هذا فجأة)
حسنًا ، حسنًا ، لقد كنت منجذبة جدًا في اتجاه الكلمات. أقرب
للعمل
بعد أن حصلت على كل شيء على نفس مجموعة بيانات caggle (https://www.kaggle.com/parthachakraborty/pneumonia-chest-x-ray) ، كتبت شبكة متسلسلة صغيرة بدقة تبلغ حوالي 85٪. في النهاية ، أخذت مجموعة بيانات مع الالتهاب الرئوي ككل ، وليس مع الالتهاب الرئوي الناجم عن فيروس كوفيد ، لأنني لم أجد مجموعات بها عدد كبير من الصور من COVID-19 ، لكن في ذلك الوقت كنت أعرف القليل عن طرق الزيادة.
لحسن الحظ ، تذكرت أن لدي صديقًا ، أخصائي أشعة ، بمساعدته تعلمت بعض التفاصيل حول الاختلافات في تشخيص الالتهاب الرئوي عن طريق الأشعة المقطعية وطرق الأشعة السينية. كما أرسلت له الصور المصنفة حسب النموذج ، والتي أخذتها من اتساع نسيج العنكبوت بناءً على طلب "الأشعة السينية للرئتين المصابة بالتهاب رئوي". كانت النتائج أسوأ قليلاً مما توقعت. لذلك ، في العديد من الصور التي اعتبرتها الشبكة على أنها التهاب رئوي جرثومي ، كان هناك بالفعل مرض السل ، والذي لم يكن ببساطة في عينة التدريب ، ولكن بخلاف ذلك كانت النسبة المئوية للأخطاء تتوافق مع model.score (X_valid، y_valid).
كنت سعيدا. ومع ذلك ، كنت أقوم بعلوم البيانات الحقيقية ، ولم أقم بتقديم الطلب رقم 70 في محاولة لاقتحام أعلى 1٪ ، متنبئين بالأسعار في ملبورن. لن أتفاجأ إذا اكتشفت أن أصحاب العقارات المحليين يتعرضون للفواق عندما يحاولون تقييم منزل. آسف ، لم أستطع المقاومة.
بشكل عام ، لقد ألهمتني ، وأرسلت عشرات الردود الجديدة و ... مرة أخرى لا شيء.
عندما خطرت لي هذه الفكرة ، لا أستطيع أن أقول إنني كنت أرشدني حصريًا بالنوايا الحسنة مثل السلام والسلام ، وإنقاذ الفقراء والآخرين. لا ، كان هدفي هو العثور على وظيفة في أسرع وقت ممكن ، ولهذا كنت بحاجة إلى التميز بطريقة إيجابية من بين الحشود نفسها "أريد أن أكون في ML".
لكن ، في الوقت نفسه ، وأنا أعاني من أزمة المراهقين "لماذا نحن هنا؟" وكوني ملحدًا ، فقد قررت بنفسي أن أجعل العالم مكانًا أفضل ، الباقي ، حسب فهمي ، ليس له قيمة حقيقية على نطاق واسع. مثالية وساذجة؟ نعم ، هذا صحيح وما فعلته ولماذا أكتب هذا المنشور على الإطلاق ينبع من هذه الصفات الخاصة بي.
قررت أن أكتب إلى حفل استقبال رئيس الاتحاد الروسي اقتراحًا تقريبًا من الطابع التالي (لم أحافظ على النص الدقيق ، لأنه مكتوب في شكل خاص على الموقع الإلكتروني للاستقبال): "أنا ، كذا وكذا ، في إطار تعيين رئيس الاتحاد الروسي للمجالات الرئيسية تطوير الدولة ، أي في إطار تطبيق ML في مختلف مجالات الدولة ، أقترح ما يلي: تنظيم جمع صور الأشعة السينية وتخزينها ، وجعل هذا التخزين متاحًا للمعالجة بواسطة أساليب ML وإمكانية تقديم الملاحظات ". ثم وصفت نموذجي بإيجاز ، وأشرت إلى أنه حتى أنا ، بأمتعي الصغيرة من المعرفة ، تمكنت من تقديم نموذج توصيته يمكن أن يعمل جنبًا إلى جنب مع أخصائي الأشعة ويكون مفيدًا. وفي روسيا يوجد عدد كبير من عشاق العاصمة يتمتعون بمستوى عالٍ من المعرفة / المهارات والذين يمكنهم فعل الكثير ليس فقط في مجال الطب ،ولكن أيضًا في المجالات الأخرى حيث ، من حيث المبدأ ، يمكنك تطبيق ML.
لسوء الحظ ، لا أتذكر النص الدقيق للاستئناف ، لأنه كان في مارس أو أبريل ، لكن المعنى العام هو نفسه تمامًا.
عند تطوير هذا الموضوع ، أود الآن أن أضيف أنه ، من حيث المبدأ ، من الضروري جمع وتجميع أكبر قدر ممكن من البيانات المفتوحة ونشرها على تناظرية من Kaggle حيث سيكون من الممكن أيضًا تعيين المهام ومناقشة الحلول والعثور على أفضلها. تقوم Rosstat بالفعل بشيء مماثل فيما يتعلق بنشر البيانات ، حتى أنني تمكنت من تحليل شيء ما ، لكن هذا الموضوع يحتاج إلى مزيد من التطوير.
تم تسجيل الرسالة ، والتي جاءت عنها رسالة منفصلة ، لكنني كنت لا أزال متفاجئًا عندما رأيت أن الإجابة جاءت. كانت الاستجابة الأولى من وزارة الصحة. كانت قصيرة وموجزة.
جوهر الجواب ، كما أراه ، هو "حسنًا ، شكرًا لك ، لا تفعل".
اعتقدت أن هذه كانت نهاية القصة ، لكن إجابة أخرى جاءت من وزارة الصناعة والتجارة. الإجابة مفصلة ومفصلة للغاية ، لكن كان لدي شعور بأنهم إما تلقوا معلومات مشوهة ، أو أنهم ببساطة أساءوا فهمي.
لم أطلب أي مساعدة مالية لتنفيذ هذا المشروع ، كما أنني لم أكتب كلمة أريد المشاركة فيها (رغم أنني بطبيعة الحال لن أرفض). حسنًا ، أجابوا ، جيد ، وشكرًا على ذلك.
كنت سأنسى هذه القصة بأمان إذا لم أصادف بانتظام أخبارًا كهذه أو هذه (حديثة جدًا) أو بشكل خاص هذه . بعد قراءته ضحكت قليلاً ، لأن هذا بالضبط ما كتبت عنه.
النتيجة
حسنًا ، لقد تم نشر المنشور.
هذه هي الأسئلة الرئيسية التي أردت طرحها.
من يشارك في تنفيذ غسل الأموال في "العمليات التجارية" للدولة؟ من يقود هؤلاء الناس؟
هل هي مركزية أم أن لكل وزارة علماء بيانات خاصين بها؟ هل هم حتى في جهاز الدولة؟
اطلعت على نص الإستراتيجية الوطنية لتطوير الذكاء الإصطناعي للفترة حتى عام 2030 ، لكن لا يزال لدي عشرات الأسئلة ، من يمكنني أن أسأل؟ للحصول على إجابة معقولة ، بالطبع.
بالنظر إلى الإجابات التي تلقيتها ، لدي بعض الشكوك في أن هذه الاستراتيجية ليست مجرد إعلان نوايا ، بل خطة حقيقية ، وأن هذا المشروع بأكمله لن يؤدي إلى تمويل العديد من مشاريع العرض "الخاصة" بالحيوانات الأليفة ، والتي سيتم الرجوع إليها بعد ذلك ، مشيرة إلى نجاح الاستراتيجية.
بشكل عام ، أي من الذين قرأوا هذا المنشور يقوم بتنفيذ أي برامج من هذه الإستراتيجية؟
شكرًا لكم جميعًا على قضاء n دقيقة من وقتكم!