المعادلة الأكثر حزنا في علم البيانات

صورة



قم بتخزين المناديل! الآن سأخبرك بالحقيقة الكاملة حول الإحصائيات وعلوم البيانات. سيكون لديك دموع في عينيك ، أعدك.



الخلاصة = البيانات + الافتراضات. وبعبارة أخرى ، لا تعطيك الإحصاءات الحقيقة.



الخرافات الشائعة



غالبًا ما يمكنك سماع المفاهيم الخاطئة التالية:



  • "إذا وجدت المعادلات الصحيحة ، يمكنني معرفة ما لا يعرفه أحد الآن".
  • "إذا قمت بإضافة رياضيات إلى بياناتي ، يمكنني تقليل عدم اليقين".
  • "يمكن للإحصاءات تحويل البيانات إلى حقيقة!"


يبدو الأمر كله مثل القصص الخيالية ، أليس كذلك؟ لأن هذا ما هم عليه.



الحقيقة المرة



لا يوجد سحر في العالم سيساعدك على صنع شيء من لا شيء. أنسى أمره. إحصائيات حول شيء آخر. خذ كلمتي على أنها إحصائية. (كمكافأة ، سيوفر لك هذا المقال الكثير من الوقت في ملاحقة هذا الحلم .)



لسوء الحظ ، سيحاول العديد من المشعوذين إقناعك بخلاف ذلك. سيستخدمون الخدعة القياسية ، "أنت لا تعرف المعادلات التي أمطرت عليك بها ، لذا اعترف بميزتي وافعل ما أقول!"



لا تقع في كلمات هؤلاء المتصنعين.



صورة نبذة عن الكاتب: كاسي كوزيركوف هو متخصص في البيانات والإحصاءات في جنوب إفريقيا. قامت بتأسيس Decision Intelligence في Google ، حيث تعتبر كبير العلماء.




لا تكرر مصير إيكاروس



فكر في الاستدلال الإحصائي (باختصار ، "إحصائيات" ) على أنه قفزة من ما نعرفه (بياناتنا المعتادة) إلى ما لا نعرفه (بُعدنا السكاني).



في الإحصائيات ، ما تعرفه ليس ما ترغب في معرفته.
ربما تريد الحقائق عن الغد ، ولكن يمكنك استخلاص الاستنتاجات فقط على أساس الأمس. (إنه أمر مزعج للغاية عندما لا نتذكر المستقبل ، أليس كذلك؟) قد ترغب في معرفة ما يفكر فيه جميع المستخدمين المحتملين حول منتجك ، ولكن يمكنك فقط أن تطلب مائة. ثم تحصل على عدم اليقين!



هذا ليس سحرًا ، هذا تخمين



كيف يمكنك القفز من ما تعرفه إلى ما لا تعرفه؟ أنت بحاجة إلى جسر لسد هذه الهوة. واسم هذا الجسر هو المضاربة. دعني أذكرك بالمعادلة الأكثر إيلامًا في علم البيانات: DATA + ASSUMPTIONS = FORECAST.



البيانات + الافتراضات = تنبؤ.
(يمكنك بسهولة استبدال كلمة "تنبؤ" بكلمة "استنتاجات" أو "تنبؤات" إذا كنت تفضل ذلك. كل شيء عن نفس الشيء: بيان حول شيء لا تعرفه بالتأكيد.)



ما هو الافتراض؟



إذا كنا نعرف كل الحقائق (وكنا متأكدين من أن هذه حقائق لا يمكن إنكارها) ، فلن نحتاج إلى افتراضات (أو إحصائيات). الافتراضات هي القطع القبيحة التي تستخدمها لبناء جسر بين ما تعرفه وما ترغب في معرفته. هذه هي طرق الغش التي عليك استخدامها عندما تحتاج إلى أن تتقارب الأرقام ، ولكن لا توجد بيانات كافية.



الافتراضات هي البقع القبيحة التي تقوم بتطبيقها في الأماكن التي لا توجد بها معلومات.
كيف يمكنني وضعه بصراحة؟ الافتراض ليس حقيقة ، إنه هراء تختلقه لأنه ليس لديك معلومات كافية. إذا كنت غالبًا ما تقلل من الناس في فواصل زمنية فائقة الدقة ، فتذكر أنه من المتهور جدًا استدعاء الحقيقة بناءً على الافتراضات. فكر في الإحصائيات بشكل أفضل كأداة لصنع القرار. هذه الأداة ليست مثالية ، لكنها لا تزال أفضل من لا شيء (في مواقف معينة).



الإحصائيات هي محاولتك للقيام بكل ما في وسعك في عالم من عدم اليقين.
الافتراضات - وفي أفريقيا ، الافتراضات. لن يتحولوا إلى حقائق بموجة عصا سحرية.



الافتراضات هي جزء من عملية صنع القرار.



أرني أي قرار اتخذ دون افتراضات. سأدرج بسهولة العديد من الافتراضات الضمنية التي تقوم بها في الحياة الواقعية دون حتى التفكير.



أمثلة: عندما تقرأ إحدى الصحف ، هل تفترض أنه تم التحقق من جميع الحقائق؟ عندما وضعت خططًا لعام 2020 ، هل افترضت أنه لن يكون هناك وباء عالمي؟ إذا قمت بتحليل البيانات ، هل تفترض أن البيانات تم تسجيلها دون أخطاء؟ هل توقعت أن يعطي مولد الأرقام العشوائية نتائج عشوائية؟ (عادةً لا تكون عشوائية.) عندما تقرر إجراء عملية شراء عبر الإنترنت ، هل تفترض أنه سيتم تحصيل المبلغ الصحيح منك؟ ماذا عن الوجبة الخفيفة الأخيرة الخاصة بك؟ هل تفترض أنه لم يسمم؟ عندما تناولت الدواء ، هل تعلم * عن تأثيره على المدى الطويل أو ... خمنت؟



سواء كنت ترغب في ذلك أم لا ، فإن الافتراضات جزء من عملية صنع القرار.


سواء كنت ترغب في ذلك أم لا ، فإن الافتراضات هي دائمًا جزء من عملية صنع القرار. ينبغي أن يتكون التدخل في بيانات العالم الحقيقي من العديد من الافتراضات المسجلة. في الوقت نفسه ، يجب على علماء البيانات وصف جميع الزوايا التي سيتعين عليهم التنقل فيها.



حتى إذا قررت الاستغناء عن الإحصاءات ، فمن المحتمل أنك تستخدم الافتراضات لتحديد كيفية المضي قدمًا. من أجل سلامتك ، يجب أن تكون على دراية بالافتراضات التي تستند إليها قراراتك.



كيف يعمل "سحر" الإحصاءات



هناك العديد من الأدوات في الإحصائيات التي تسمح لك بصياغة الافتراضات ودمجها مع الأدلة. لذلك ولدت قرارات ذكية. (انظر إلى مقدمة الإحصائيات التي مدتها 8 دقائق هنا).



من السخف أن نتوقع أن التحليل ، بما في ذلك عدم اليقين والاحتمال ، سيصبح مصدر الحقيقة برأس مال "P".
نعم ، هكذا يعمل السحر الإحصائي. يمكنك اختيار الافتراضات التي ستعيش معها ، ثم دمجها مع البيانات. على أساس هذا الاتحاد غير المقدس ، تتخذ قرارات ذكية. هذه كل الإحصائيات.



صورة



هذا هو السبب في أن التحليل الذي يتضمن عدم اليقين والاحتمالية لا يمكن أن يكون مصدرًا للحقيقة برأس مال "P". لا يوجد سر الظلام المظلم يفعل ذلك لك.



يمكن أن يتوصل شخصان إلى استنتاجات مختلفة تمامًا استنادًا إلى نفس البيانات! يكفيهم أن يضعوا افتراضات مختلفة.
للسبب نفسه ، يمكن أن يصل شخصان إلى استنتاجات مختلفة تمامًا استنادًا إلى نفس البيانات! يكفيهم أن يضعوا افتراضات مختلفة. تمنحك الإحصائيات أداة تسمح لك باتخاذ القرارات بوعي أكبر ، ولكن لا توجد قاعدة واحدة لاستخدامها. إنها أداة شخصية لاتخاذ القرار.



تعتمد جودة أدائك في البحث على مدى جودة الافتراضات التي تقوم بها.



ماذا عن العلم؟



ماذا يحدث عندما يستخدم العالم الإحصائيات لاستخلاص النتائج؟ إنه ببساطة يشكل رأيًا ويقرر مشاركته مع العالم كله. هذا ليس سيئًا ، يجب على العلماء استخلاص الاستنتاجات من وقت لآخر عن طريق الإرادة ، وليس عن طريق الإرادة ، هذه هي وظيفتهم. أفترض أنه يمكن في بعض الأحيان مراعاة هذه الاستنتاجات.



عن طريق الإرادة ، يجب على العلماء بشكل دوري استخلاص الاستنتاجات بناءً على الإحصائيات ، وهذا هو عملهم.
أنا أستمتع بالاستماع إلى المشورة من الأشخاص الذين لديهم معلومات وخبرات أكثر مني ، لكنني لا أسمح لنفسي أبدًا بخلط الآراء مع الحقائق. هناك علماء على دراية جيدة بالاحتمال ويعملون معه. ومع ذلك ، التقيت أيضًا بعلماء ارتكبوا العديد من الأخطاء الإحصائية لدرجة أنك لن تخرجهم أبدًا من حياتك. لا يمكن للآراء (ويجب ألا تؤثر) على الأشخاص غير المستعدين لصياغة الافتراضات لأنفسهم. تم الحصول على هذه الآراء من خلال مجموعة من الأدلة والافتراضات التي لم يتم التحقق منها. لا يمكن اعتبارهم أكفاء.



ملخص



فكر في الإحصائيات كعلم يمكنه مساعدتك في اتخاذ القرارات عندما تكون غير متأكد من شيء ما. هذا إطار يساعدك على اتخاذ قرارات مستنيرة مع نقص المعلومات. لا توجد طريقة واحدة صحيحة لاستخدام الإحصاءات.



لا ، لا يمنحك الحقائق التي تريدها. يمنحك ما تحتاجه للتعامل مع نقص الحقائق. الهدف من الإحصاءات هو مساعدتك على بذل قصارى جهدك في عالم من عدم اليقين.



ما عليك سوى إجراء افتراضات.



الترجمة: ديانا شيريميفا



صورة



تعرف على المزيد حول كيفية الحصول على مهنة مرغوبة من الصفر أو المستوى الأعلى في المهارات والراتب من خلال إكمال دورات SkillFactory المدفوعة عبر الإنترنت:











All Articles