علوم البيانات هي مضخم للتفكير والحدس والإلهام

صورة




واحدة من التقنيات الأولى في العالم لتخزين وتبادل البيانات.



في القرن التاسع عشر ، كان بإمكان الأطباء وصف الزئبق لتقلبات المزاج والزرنيخ لعلاج الربو. ربما لم يخطر ببالهم غسل أيديهم قبل الجراحة. بالطبع ، لم يحاولوا قتل أي شخص - لم يعرفوا أن هناك طرقًا أكثر ملاءمة.



كان لدى هؤلاء الأطباء الأوائل بيانات قيمة مكتوبة على دفاتر ملاحظاتهم ، لكن كل منهم رأى قطعة واحدة فقط من أحجية كبيرة. بدون الأدوات الحديثة لتبادل المعلومات وتحليلها (بالإضافة إلى العلم لفهم هذه البيانات) ، لا شيء يمكن أن يمنع الخرافات من التأثير على ما يمكن رؤيته من خلال "ثقب المفتاح" للحقائق المرصودة.



لقد قطع البشر شوطًا طويلاً في مجال التكنولوجيا منذ ذلك الحين ، لكن الطفرة الحالية في التعلم الآلي والذكاء الاصطناعي ليست بعيدة عن الماضي. كل هذا استمرار للغريزة الإنسانية الأساسية - فهم العالم من حولنا. هذه الغريزة ضرورية حتى نتمكن من اتخاذ قرارات أكثر ذكاءً. ولدينا الآن تقنية أفضل بكثير من أي وقت مضى.



إحدى الطرق لوصف هذا النمط الذي كان يحدث عبر العصور هو التفكير فيه على أنه ثورة في مجموعات البيانات ، وليس وحدات البيانات. الفرق ليس تافها. ساعدت كميات هائلة من البيانات في تشكيل العالم الحديث. لنأخذ على سبيل المثال الكتبة السومريين (العراق المعاصر) الذين ضغطوا على قلمهم لألواح الطين منذ أكثر من 5000 عام. عندما فعلوا ذلك ، لم يخترعوا فقط نظام الكتابة الأول ، ولكن التقنية الأولى لتخزين وتبادل البيانات.



إذا كنت مستوحى من الوعد بأن الذكاء الاصطناعي يمكن أن يتجاوز القدرات البشرية ، ففكر في القرطاسية لإعطائنا ذكريات خارقة. في حين أنه من السهل أخذ تسجيل المعلومات كأمر مسلم به اليوم ، فإن القدرة على تخزين مجموعات البيانات بأمان تمثل خطوة أولى رائدة نحو ذكاء أعلى.



لسوء الحظ ، يعد استخراج المعلومات من الألواح الطينية ونظرائهم قبل الإلكترونيين مؤلمًا. لا يمكنك النقر بإصبعك على كتاب لحساب عدد الكلمات فيه. بدلاً من ذلك ، يجب عليك تحميل كل كلمة في دماغك لمعالجتها. جعلت قضايا مثل هذه التحليل المبكر للبيانات شاقة ، لذا فقد علقت المحاولات المبكرة في وقت مبكر جدًا. في حين أن المملكة يمكن أن تحلل عائدات الضرائب ، إلا أن الروح الشجاعة هي التي يمكن أن تحاول التفكير على نحو فعال في مجال مثل الطب ، حيث شجع تقليد الألف عام على الارتجال.



صورة



لحسن الحظ ، أنتج الجنس البشري روادًا رائعين. على سبيل المثال ، ألهمت خريطة وفاة جون سنو ، التي تم جمعها خلال تفشي الكوليرا في لندن عام 1858 ، الأطباء لإعادة النظر في الخرافة القائلة بأن المرض سببه miasma (الهواء السام) ، والاهتمام بمياه الشرب.



صورة



إذا كنت تعرف The Lady with the Lamp ، فلورنس نايتنجيل ، لتعاطفها البطولي كممرضة ، فقد تفاجأ عندما تعلم أنها كانت أيضًا رائدة في مجال التحليلات. أنقذ مخطط معلوماتها الابتكاري أثناء حرب القرم العديد من الأرواح لأنه حدد مشاكل النظافة على أنها السبب الرئيسي للوفيات في المستشفيات ، وكان هذا الرسم البياني الذي ألهم الحكومة بالاهتمام بالصرف الصحي.



صورة



ظهر عصر مجموعات البيانات الموحدة حيث بدأت قيمة المعلومات في تأكيد نفسها في المزيد والمزيد من المجالات ، مما أدى إلى ظهور أجهزة الكمبيوتر. وهذا ليس عن الصديق الإلكتروني الذي اعتدت عليه اليوم. نشأ "الكمبيوتر" (الحاسبة) كمهنة بشرية ، عندما قام موظفون خاصون بإجراء العمليات الحسابية ومعالجة البيانات يدويًا لتقييم أهميتها.



صورة



هؤلاء الناس كانوا كلهم ​​حواسيب! تم التقاط الصورة في الخمسينيات من قبل طاقم نفق الضغط الأسرع من الصوت .



جمال البيانات هو أنها تسمح لك بتشكيل حكم من شيء أكثر معنى من الهواء الرقيق. من خلال النظر إلى البيانات ، أنت مستوحى لطرح أسئلة جديدة ، باتباع خطى فلورنس نايتنجيل وجون سنو. هذا هو نظام التحليلات: لإلهام النماذج والفرضيات من خلال البحث.



من مجموعات البيانات إلى تقسيم البيانات



في أوائل القرن العشرين ، أدت الرغبة في اتخاذ قرارات أفضل في مواجهة عدم اليقين إلى ولادة مهنة موازية: الإحصائيات. يساعد الإحصائيون في التحقق مما إذا كان من المعقول التصرف وفقًا للظاهرة التي اكتشفها المحلل في مجموعة البيانات الحالية (وما بعدها).



مثال مشهور هو رونالد أ. فيشر ، الذي طور أول كتاب مدرسي في العالم عن الإحصائيات. يصف فيشر إجراء اختبار الفرضية ردًا على ادعاء صديقه أنه يمكنه تحديد ما إذا كان الحليب قد أضيف إلى الشاي قبل الماء أم بعده. على أمل أن يثبت أن هذا لم يكن صحيحًا ، بناءً على البيانات ، كان عليه أن يستنتج أن صديقه كان بإمكانه فعل ذلك.



إن التحليلات والإحصاءات لها كعب أخيل كبير: إذا كنت تستخدم نفس قطعة البيانات لإنشاء فرضية واختبارها ، فأنت تغش. تتطلب دقة الإحصاءات منك إعلان نواياك قبل اتخاذ الإجراء المناسب. Analytics عبارة عن لعبة استرجاعية ممتدة. كانت التحليلات والإحصاءات غير متوافقة بشكل محبط حتى قامت الثورة الرئيسية التالية (مشاركة البيانات) بتغيير كل شيء.



مشاركة البيانات هي فكرة بسيطة ، ولكنها واحدة من أهم الأفكار للعلماء مثلي. إذا كان لديك مجموعة بيانات واحدة فقط ، فعليك الاختيار بين التحليلات (الإلهام غير المبرر) والإحصاءات (الاستدلالات القوية). هل تريد خدعة؟ قسم مجموعة البيانات الخاصة بك إلى قسمين وستحصل على كل من الذئاب والأغنام آمنة!



يزيل عصر مجموعتي البيانات التوتر بين التحليلات والإحصاءات ويقدم العمل المنسق بين نوعين مختلفين من علماء البيانات. يستخدم المحللون مجموعة واحدة من البيانات لمساعدتك في صياغة الأسئلة ، ويستخدم الإحصائيون مجموعة مختلفة من البيانات لتقديم إجابات قوية.



يضع هذا الترف مطالب صارمة على كمية البيانات. الحديث عن الانفصال أسهل من تنفيذه فعليًا. أنت تعرف ما يدور حوله إذا حاولت جمع معلومات كافية لمجموعة بيانات لائقة واحدة على الأقل. عصر مجموعات البيانات المزدوجة هو تطور جديد يسير جنبًا إلى جنب مع معدات معالجة بيانات أفضل ، وتكاليف تخزين أقل ، والقدرة على مشاركة المعلومات التي تم جمعها عبر الإنترنت.



في الواقع ، فإن الابتكارات التكنولوجية التي أدت إلى عصر مجموعات البيانات المزدوجة قد بشرت بسرعة في المرحلة التالية - عصر مجموعات البيانات الثلاث التلقائية.



هناك مصطلح مألوف أكثر لهذا: التعلم الآلي.



يؤدي استخدام مجموعة البيانات إلى تدمير نقائها كمصدر للدقة الإحصائية. لديك فرصة واحدة فقط ، فكيف تعرف أي البصيرة التحليلية تستحق الاختبار؟ إذا كان لديك مجموعة بيانات ثالثة ، فيمكنك استخدامها لإجراء اختبار قيادة لفكرتك. تُسمى هذه العملية التحقق ، وهي في صميم ما يجعل التعلم الآلي يعمل.



بمجرد أن تكون حراً في اختبار كل شيء ورؤية أفكار قوية ، يمكنك أن تثق في أي شخص لإيجاد حل: محللون متمرسون ، متدربون ، أوراق شاي لقول الحظ ، وحتى خوارزميات تعمل خارج السياق عن مشكلة عملك. الحل الذي يحقق أفضل أداء في عملية التحقق سيصبح مرشحًا للاختبار الإحصائي المناسب. لقد مكنت نفسك للتو من القدرة على أتمتة الإلهام!



إلهام آلي



هذا هو السبب في أن التعلم الآلي يُحدث ثورة في مجموعات البيانات ، وليس البيانات فقط. كل شيء عن رفاهية الحصول على بيانات كافية لتقسيم ثلاثي.



كيف يتناسب الذكاء الاصطناعي مع هذه الصورة؟ يسمى التعلم الآلي مع الشبكات العصبية متعددة الطبقات من الناحية الفنية التعلم العميق ، لكنه تلقى لقبًا آخر عالقًا في الكلام: AI. في حين أن الذكاء الاصطناعي كان له معنى مختلف في يوم من الأيام ، فمن المرجح استخدامه اليوم بشكل مترادف مع التعلم العميق.



خلقت الشبكات العصبية العميقة ضجة من خلال التغلب على خوارزميات التعلم الآلي التقليدية في العديد من المشاكل المعقدة. ومع ذلك ، فإنها تتطلب الكثير من البيانات لتدريبهم ، ومتطلبات قدرات معالجة البيانات تتجاوز قدرات الكمبيوتر المحمول التقليدي. لهذا السبب يرتبط ظهور الذكاء الاصطناعي الحديث بالتقنيات السحابية. تتيح لك تقنية السحابة استئجار مركز بيانات لشخص آخر بدلاً من تجميع الأجهزة بنفسك ، حتى تتمكن من تجربة تقنيات الذكاء الاصطناعي الحديثة قبل البدء في الاستثمار فيها.



مع هذه القطعة من اللغز ، لدينا مجموعة كاملة من المهن: التعلم الآلي وخبراء الذكاء الاصطناعي والمحللين والإحصائيين. المصطلح العام الذي يصف كل واحد منهم هو خبير في علوم البيانات ، وهو العلم الذي يجعل البيانات مفيدة.



علوم البيانات هي نتاج عصرنا من مجموعات البيانات الثلاثية. تنتج العديد من الصناعات في صناعة اليوم بانتظام بيانات أكثر من كافية. إذن ، هل نهج مجموعة البيانات الأربعة ممكن؟



ما هي الخطوة التالية إذا كان النموذج الذي دربته يظهر قيم تحقق منخفضة؟ إذا كنت تتصرف مثل معظم الناس ، فسوف تطلب على الفور معرفة السبب! للأسف ، لا توجد مجموعة بيانات يمكنها الإجابة عن سؤالك. قد تميل إلى البحث في مجموعة بيانات التحقق ، ولكن للأسف ، سيؤدي تصحيح الأخطاء إلى كسر قدرتها على التحقق من صحة نماذجك بفاعلية.



من خلال تحليل مجموعة بيانات التحقق ، فأنت تحول ثلاث مجموعات بيانات إلى مجموعتين. بدلاً من القيام بشيء مفيد ، عدت إلى الماضي بشكل لا إرادي!



يقع الحل خارج مجموعات البيانات الثلاث التي تستخدمها بالفعل. للوصول إلى تكرارات تعلم أكثر ذكاءً وضبط فرط المعلمات ، سترغب في الاقتراب من أفضل الممارسات: عصر أربع مجموعات بيانات.



بافتراض أن ثلاث مجموعات بيانات تزودك بالإلهام وتكرارات التعلم والاختبارات الصارمة ، ستسرع الرابعة دورة تطوير الذكاء الاصطناعي من خلال التحليلات المتقدمة التي توفر نظرة ثاقبة للطرق التي يمكن تجربتها في كل تكرار. باستخدام مشاركة البيانات رباعية الاتجاهات ، يمكنك الاستفادة من وفرة البيانات! مرحبا بكم في المستقبل.



صورة



تعرف على تفاصيل كيفية الحصول على مهنة رفيعة المستوى من الصفر أو المستوى الأعلى في المهارات والراتب من خلال الحصول على دورات SkillFactory المدفوعة عبر الإنترنت:











All Articles