
قام فريق Mail.ru Cloud Solutions بترجمة مقالة مختصرة كتبها كيفين وو ، والتي تناقش ما حققته صناعة الأدوية والرعاية الصحية بالفعل باستخدام الذكاء الاصطناعي والتعلم الآلي ، ومتى ستساعد التقنيات الجديدة في العثور على الأدوية من جميع الأمراض.
لماذا قد يبدو أنه لا يوجد تقدم
يعبر بعض الناس عن إحباطهم من الحياة بشيء مثل هذا: "إذا كان هذا هو المستقبل ، فأين حقيبتي الطائرة؟" للوهلة الأولى، فإن مثل هذا التوق إلى مستقبل الرجعية يبدو غريبا في عصر الحوسبة في كل مكان، خلايا برمجة وانبعاث استكشاف الفضاء . لكن بالنسبة للبعض ، فإن هذا الحنين إلى المستقبل يصمد بشكل مدهش. إنهم يتشبثون بالتنبؤات التي تبدو غريبة في الماضي ، متجاهلين الحقيقة المذهلة التي لا يمكن لأحد توقعها.
من كان يظن أنه بفضل التعلم العميق يمكننا التنبؤ بخصائص الأدوية التي لم توجد بعد؟ هذا له أهمية كبيرة لصناعة الأدوية.
فيما يتعلق بالذكاء الاصطناعي ، قد تبدو الشكاوى كالتالي: "مرت ثماني سنوات تقريبًا منذ اختراع شبكة AlexNet العصبية [ تقريبًا. مترجم : في عام 2012 ، نشر Aleksey Krizhevsky تصميم الشبكة العصبية التلافيفية AlexNet ، التي فازت بمسابقة ImageNet بهامش كبير] ، فأين سيارتي ذاتية القيادة؟ " في الواقع ، قد يبدو أن توقعات منتصف عام 2010 لم تتحقق. بين المتشائمين ، تكتسب توقعات الركود القادم في أبحاث الذكاء الاصطناعي زخمًا .
الغرض من هذا المقال هو مناقشة التقدم الكبير في التعلم الآلي في تحدي اكتشاف الأدوية في العالم الحقيقي. أريد أن أذكرك بمثل قديم آخر ، هذه المرة من باحثي الذكاء الاصطناعي. لإعادة الصياغة قليلاً ، يبدو الأمر كما يلي: "يُطلق على الذكاء الاصطناعي اسم AI حتى يعمل ، فهو مجرد برنامج."
ما كان حتى سنوات قليلة ماضية يعتبر بحثًا أساسيًا متطورًا في التعلم الآلي يُشار إليه الآن باسم " علم البيانات فقط " (أو حتى التحليلات) - ويحدث ثورة في صناعة الأدوية. هناك فرصة قوية أن استخدام التعلم العميق لاكتشاف المخدرات سيغير حياتنا بشكل كبير نحو الأفضل.
الرؤية الحاسوبية والتعلم العميق في التصوير الطبي الحيوي
بمجرد أن تمكن العلماء من الوصول إلى أجهزة الكمبيوتر والقدرة على تحميل الصور هناك ، حاولوا على الفور معالجتها. في الأساس ، نحن نتحدث عن الصور الطبية الحيوية: الصور الشعاعية والموجات فوق الصوتية ونتائج التصوير بالرنين المغناطيسي. بالعودة إلى أيام الذكاء الاصطناعي القديم الجيد ، كانت المعالجة عادةً تعني استنتاج البيانات المنطقية يدويًا بناءً على سمات بسيطة مثل الخطوط العريضة والسطوع.
شهدت الثمانينيات تحولًا نحو خوارزميات التعلم الآلي الخاضعة للإشراف، لكنهم ما زالوا يعتمدون على العلامات الموضوعة يدويًا. يتم تدريب نماذج التعلم البسيط الخاضع للإشراف (مثل الانحدار الخطي أو التقريب متعدد الحدود) على الميزات المستخرجة بواسطة الخوارزميات مثل SIFT (تحويل الميزات الثابتة للمقياس) و HOG (الرسم البياني للتدرج الاتجاهي). لا ينبغي أن يكون مفاجئًا أن التطورات التي أدت إلى التطبيق العملي للتعلم العميق اليوم بدأت منذ عقود.
تم استخدام الشبكات العصبية التلافيفية لأول مرة لتحليل الصور الطبية الحيوية في عام 1995 ، عندما كان لو وزملاؤهقدم نموذجًا للتعرف على الأورام السرطانية في الرئتين في التصوير الفلوري. كانت طريقتهم مختلفة قليلاً عما اعتدنا عليه اليوم ، واستغرق اشتقاق النتيجة حوالي 15 ثانية ، لكن المفهوم كان هو نفسه - مع التعلم من خلال الانتشار العكسي على طول الطريق إلى النوى التلافيفية للشبكة العصبية. تضمن نموذجهم طبقتين مخفيتين ، في حين أن معماريات الشبكات العميقة الشائعة اليوم تحتوي غالبًا على مائة طبقة أو أكثر.
تقدم سريعًا إلى عام 2012. أحدثت الشبكات العصبية التلافيفية نجاحًا كبيرًا مع ظهور نظام AlexNet ، مما أدى إلى قفزة في أداء مجموعة بيانات ImageNet الشهيرة الآن. أصبح نجاح AlexNet ، وهي شبكة مكونة من خمس طبقات تلافيفية وثلاث طبقات مترابطة بإحكام مدربة على وحدات معالجة الرسومات للألعاب ، مشهورة جدًا في التعلم الآلي الذي يتحدث عنه الناس الآنMoments of ImageNet "في مجالات مختلفة من التعلم الآلي والذكاء الاصطناعي.
على سبيل المثال ، "ربما تكون معالجة اللغة الطبيعية قد تجاوزت فترة ImageNet الخاصة بها مع تطوير محولات كبيرة في 2018" أو "لا يزال التعلم المعزز ينتظر لحظة ImageNet الخاصة به."
لقد مرت عشر سنوات تقريبًا منذ AlexNet. تتحسن رؤية الكمبيوتر ونماذج التعلم العميق تدريجياً. لقد تجاوزت التطبيقات التصنيف. لقد تعلموا اليوم كيفية تقسيم الصور وتقدير العمق وإعادة بناء المشاهد ثلاثية الأبعاد تلقائيًا من صور ثنائية الأبعاد متعددة. وهذه ليست قائمة كاملة لقدراتهم.
أصبح التعلم العميق لتحليل التصوير الطبي الحيوي مجالًا ساخنًا للبحث. التأثير الجانبي هو زيادة حتمية في الضوضاء. نُشرت عام 2019ما يقرب من 17000 مقال علمي حول التعلم العميق . بالطبع ، ليست جميعها تستحق القراءة. من المحتمل أن يقوم العديد من الباحثين بإفراط في استخدام النماذج على مجموعات بياناتهم المتواضعة.
لم يقدم معظمهم أي مساهمات في العلوم الأساسية أو التعلم الآلي. استحوذ الشغف بالتعلم العميق على الباحثين الأكاديميين الذين لم يبدوا أي اهتمام به في السابق ، ولسبب وجيه. يمكنها أن تفعل ما تفعله خوارزميات الرؤية الحاسوبية الكلاسيكية (انظر نظرية التقريب الشامل لتسيبينكو وهورنيك) ، وغالبًا ما تقوم بذلك بشكل أسرع وأفضل ، مما يوفر المهندسين من التصميم اليدوي الممل لكل تطبيق جديد.
فرصة نادرة لمحاربة الأمراض "المهملة"
يقودنا هذا إلى موضوع اكتشاف الأدوية اليوم - الصناعة التي تشهد تغييرًا جيدًا. إن شركات الأدوية ومقاوليها مغرمون بتكرار التكاليف الباهظة لطرح دواء جديد في السوق. ترجع هذه التكاليف إلى حد كبير إلى حقيقة أن العديد من الأدوية تستغرق وقتًا طويلاً للدراسة والاختبار قبل تناولها.
يمكن أن تصل تكلفة تطوير دواء جديد إلى 2.5 مليار دولار أو أكثر . في بعض الأحيان ، بسبب التكلفة العالية والربحية المنخفضة نسبيًا ، يتم إهمال عدد من الأعمال المتعلقة بفئات معينة من الأدوية إلى الخلفية .
كما أنه يؤدي إلى ارتفاع حاد في الإصابة بالفئة المسماة على نحو ملائم "الأمراض المهملة" ، بما في ذلك عدد غير متناسب من أمراض المناطق المدارية.تصيب أفقر البلدان وتعتبر غير مواتية للعلاج ؛ والأمراض النادرة ذات معدلات الإصابة المنخفضة. يعاني عدد قليل نسبيًا من الأشخاص من كل منهما ، لكن العدد الإجمالي للأشخاص المصابين بجميع الأمراض النادرة كبير جدًا. يقدر بحوالي 300 مليون شخص. وحتى هذا الرقم قد يتبين أنه أقل من الواقع بسبب التقييم الكئيب للخبراء: حوالي 30٪ ممن يعانون من مرض نادر لا يعيشون خمس سنوات.
" ذيل طويل»للأمراض النادرة إمكانات كبيرة لتحسين حياة أعداد هائلة من الناس ، وهنا يأتي دور التعلم الآلي والبيانات الضخمة للإنقاذ. تفتح النقطة العمياء للأمراض النادرة (اليتيمة) التي ليس لها علاج معتمد رسميًا فرصة للابتكار من فرق صغيرة من علماء الأحياء ومطوري التعلم الآلي.
تحاول إحدى هذه الشركات الناشئة في سولت ليك سيتي ، يوتا أن تفعل ذلك بالضبط. يرى مؤسسو شركة Recursion Pharmaceuticals أن نقص الأدوية لعلاج الأمراض النادرة يمثل فجوة في صناعة الأدوية. يتلقون كميات هائلة من البيانات من خلال تحليل نتائج الفحص المجهري والاختبارات المعملية. بمساعدة الشبكات العصبية ، من الممكن تحديد سمات الأمراض والبحث عن طرق العلاج.
بحلول نهاية عام 2019 ، كانت الشركة قد أجرت آلاف التجارب وجمعت أكثر من 4 بيتابايت من المعلومات. لقد نشروا مجموعة فرعية صغيرة من هذه البيانات (46 جيجابايت) لمسابقة NeurIps 2019 ، يمكنك تنزيلها من موقع RxRx الإلكتروني واللعب بمفردك.
يعتمد سير العمل الموضح في هذه المقالة إلى حد كبير على معلومات من الأوراق البيضاء لشركة Recursion Pharmaceuticals [ pdf ] ، ولكن قد يكون هذا النهج بمثابة مصدر إلهام لمجالات أخرى.
وتشمل الشركات الناشئة الأخرى في هذا المجال مختبرات Bioage Labs (أمراض الشيخوخة) والمختبرات البارزة (علم الأورام) و TwoXAR.(أمراض مختلفة لا توجد خيارات علاج لها). عادةً ما تشارك الشركات الناشئة في تقنيات معالجة البيانات المبتكرة وتطبق مجموعة متنوعة من أساليب التعلم الآلي بالإضافة إلى التعلم العميق باستخدام رؤية الكمبيوتر أو بدلاً منه.
بعد ذلك ، سأصف عملية تحليل الصور ومدى ملاءمة التعلم العميق لسير عمل اكتشاف دواء للأمراض النادرة. سننظر في عملية عالية المستوى قابلة للتطبيق على مجموعة متنوعة من المجالات الأخرى لاكتشاف الأدوية.
على سبيل المثال ، يمكن استخدامه بسهولة لفحص أدوية السرطان لمعرفة تأثيرها على مورفولوجيا الخلايا السرطانية. ربما حتى لتحليل استجابة خلايا مرضى معينين لخيارات الأدوية المختلفة. يستخدم هذا النهج مفاهيم من تحليل المكون الرئيسي غير الخطي، التجزئة الدلالية [ pdf ] وتصنيف جيد لصورة الشبكة العصبية التلافيفية القديمة.
التصنيف في الضوضاء المورفولوجية
علم الأحياء فوضى. لذلك ، يعد الفحص المجهري متعدد العوامل عالي الإنتاجية مصدرًا للإحباط المستمر لعلماء الأحياء الخلوية. الصور الناتجة تختلف اختلافا كبيرا من تجربة إلى أخرى. تؤدي التقلبات في درجة الحرارة ووقت التعرض وكمية الكواشف وغيرها إلى تغييرات لا تتعلق بالنمط الظاهري المدروس أو عمل الدواء ، وبالتالي بأخطاء في النتائج التي تم الحصول عليها.
ربما يعمل التحكم في المناخ في المختبر بشكل مختلف في الصيف والشتاء؟ ربما تناول شخص ما الغداء بجانب الشرائح قبل إدخالها في المجهر؟ ربما تغير مورد أحد مكونات وسط الثقافة؟ أو هل قام المورد بتغيير مورده؟ يؤثر عدد كبير من المتغيرات على نتيجة التجربة. يعد تتبع الضوضاء غير المقصودة وإبرازها أحد التحديات الرئيسية في اكتشاف الأدوية القائمة على البيانات.
يمكن أن تكون الصور تحت المجهر مختلفة جدًا في نفس التجارب. يتغير سطوع الصورة وشكل الخلايا وشكل العضيات والعديد من الخصائص الأخرى بسبب التأثيرات الفسيولوجية المقابلة أو الأخطاء العشوائية.
لذلك ، تم الحصول على الصور في الشكل أدناه من نفسمجموعة متاحة للجمهور من الصور المجهرية للخلايا السرطانية النقيلي قام بتجميعها سكوت ويلكنسون وآدم ماركوس. يجب أن تعكس الاختلافات في التشبع والتشكيل عدم اليقين في البيانات التجريبية. يتم إنشاؤها عن طريق إدخال التشوهات في المعالجة. إنه نوع من التناظرية للزيادة ، والتي يستخدمها الباحثون لتنظيم الشبكات العصبية العميقة في مشاكل التصنيف. لذلك ، لا ينبغي أن يكون مفاجئًا أن القدرة على تعميم النماذج الكبيرة على مجموعات البيانات الكبيرة هي خيار منطقي للبحث عن ميزات فسيولوجية مهمة في بحر من الضوضاء.
علامات فعالية العلاج والآثار الجانبية بين البيانات الصاخبة
عادة ما يكون السبب الرئيسي للأمراض النادرة هو الطفرة الجينية. لبناء نماذج لإيجاد علاج لهذه الأمراض ، من الضروري فهم تأثيرات مجموعة واسعة من الطفرات وعلاقتها بالأنماط الظاهرية المختلفة. لمقارنة العلاجات الممكنة لمرض نادر بشكل فعال ، يتم تدريب الشبكات العصبية على أساس الآلاف من الطفرات المختلفة.
يمكن تقليد هذه الطفرات عن طريق قمع التعبير الجيني باستخدام رنا صغيرة متداخلة(سيرنا). يشبه الأمر إلى حد ما إمساك الأطفال بكاحليك: حتى لو تمكنت من الجري بسرعة ، ستنخفض سرعتك بشكل كبير مع تعليق ابنة أختك أو ابن أخيك من كل ساق. يعمل siRNA بطريقة مماثلة: تلتصق سلسلة صغيرة من RNAs المتداخل بالأجزاء المقابلة من RNA المرسال لجينات معينة ، مما يمنع التعبير الكامل عنها.
من خلال التعلم من آلاف الطفرات بدلاً من نموذج خلوي وحيد لمرض معين ، تتعلم الشبكة العصبية ترميز الأنماط الظاهرية في مساحة مخفية متعددة الأبعاد. يتيح الكود الناتج تقييم الأدوية من خلال قدرتها على تقريب النمط الظاهري للمرض من النمط الظاهري الصحي ، ويتم تمثيل كل منها بمجموعة متعددة الأبعاد من الإحداثيات. وبالمثل ، يمكن تضمين الآثار الجانبية للأدوية في التمثيل المشفر للنمط الظاهري ، ويتم تقييم الأدوية ليس فقط من أجل اختفاء أعراض المرض ، ولكن أيضًا لتقليل الآثار الجانبية الضارة.
يوضح الرسم البياني تأثير العلاج على النموذج الخلوي للمرض (ممثلة بنقطة حمراء). العلاج هو حركة النمط الظاهري المشفر أقرب إلى النمط الظاهري الصحي (النقطة الزرقاء). هذا تمثيل ثلاثي الأبعاد مبسط للتشفير الظاهري في مساحة مخفية متعددة الأبعاد
. نماذج التعلم العميق المستخدمة لسير العمل هذا تشبه إلى حد بعيد مشاكل التصنيف الأخرى مع مجموعة بيانات كبيرة ، على الرغم من أنك إذا كنت معتادًا على العمل مع عدد صغير من الفئات ، كما هو الحال في مجموعات بيانات CIFAR-10 و CIFAR-100 ، لن تعتاد على الفور على آلاف علامات التصنيف المختلفة.
أيضًا ، تعمل طريقة اكتشاف الأدوية القائمة على الصور بشكل جيد مع نفس بنية DenseNet أو ResNet مع مئات الطبقات ، مما يوفر الأداء الأمثل على مجموعات البيانات مثل ImageNet.
تعكس قيم تنشيط الطبقة المشفرة في فضاء متعدد الأبعاد النمط الظاهري ، وتسبب المرض ، والعلاقات بين العلاجات ، والآثار الجانبية ، والأمراض الأخرى. لذلك ، يمكن تحليل كل هذه العوامل عن طريق الإزاحة في الفضاء المشفر. يمكن أن يخضع رمز النمط الظاهري هذا لتنظيم خاص (على سبيل المثال ، عن طريق تقليل التباين بين عمليات التنشيط المختلفة للطبقات) لتقليل ارتباطات التشفير أو لأغراض أخرى.
يوضح الشكل أدناه نموذجًا مبسطًا. تمثل الأسهم السوداء عمليات الالتفاف + التجميع. تمثل الخطوط الزرقاء اتصالات ضيقة. للتبسيط ، تم تقليل عدد الطبقات ولم تظهر الوصلات المتبقية.
توضيح مبسط لنموذج التعلم العميق لاكتشاف الأدوية
مستقبل التعلم العميق في اكتشاف الأدوية والصناعة الصيدلانية
أدت التكلفة العالية لجلب أدوية جديدة إلى السوق إلى قيام شركات الأدوية في كثير من الأحيان باختيار نتائج السوق بدلاً من البحث عن أدوية للأمراض الخطيرة. إن فرق تحليل البيانات الأصغر في الشركات الناشئة مجهزة بشكل أفضل للابتكار في هذا المجال ، بينما توفر الأمراض المهملة والنادرة فرصة لدخول السوق وإثبات قيمة التعلم الآلي.
تم إثبات فعالية هذا النهج. نحن نشهد تقدمًا كبيرًا في الأبحاث وهناك العديد من الأدوية في المرحلة الأولى من التجارب السريرية. على سبيل المثال ، تحقق فرق من بضع مئات من العلماء والمهندسين في شركات مثل Recursion Pharmaceuticals ذلك. الشركات الناشئة الأخرى قريبة: لدى TwoXAR العديد من الأدوية المرشحة التي تخضع لتجارب ما قبل السريرية في فئات أخرى من الأمراض.
من المتوقع أن يكون لنهج التعلم العميق ورؤية الكمبيوتر لتطوير الأدوية تأثير كبير على شركات الأدوية الكبرى والرعاية الصحية بشكل عام. سنرى قريبًا كيف يؤثر ذلك على تطوير علاجات جديدة للأمراض الشائعة (بما في ذلك أمراض القلب والسكري) ، فضلاً عن الأمراض النادرة التي ظلت بعيدة عن الأنظار حتى الآن.
ماذا تقرأ عن الموضوع: