اختبارات الأهمية الإحصائية هي أدوات معيبة بشكل فظيع

عندما شاركت في تطوير المنتجات ، شعرت بالغضب الشديد من المصممين البراغماتيين - أولئك الذين حاولوا القيام بكل شيء فقط على أساس البحث الإحصائي. 

لذلك أريد أن يكون الزر أخضر ، فقط لأنني أحب ذلك بهذه الطريقة. ويقول المصمم - "لا يهم ، أظهرت اختبارات AB أن زر لون الإسهال يتم النقر عليه بنسبة 0.2٪ أكثر". يا رب يا صديقي ، لقد كنت تضخ ذوقك وخبرتك لمدة عشر سنوات ، فماذا في ذلك؟ لجعل منتجاتنا تبدو مثل أنبوب الطيور؟ لكن العمل يقول - نظرًا لوجود أرقام ، فسنغطي كل شيء بها.

أنا أفهم أن الناس يريدون كسب المال. لا يريدون الوثوق بأذواقهم عندما يتعلق الأمر بإرضاء الجماهير. لكنني أعلم الآن أن المشكلة قد لا تكون في الأرقام ، ولكن في الأشخاص الذين لا يعرفون كيفية استخدام الاختبارات الإحصائية.

الأسبوع الماضي في البودكاست الخاص بنا كان أندريه أكينشين ، حاصل على درجة الدكتوراه في الفيزياء والرياضيات وخبير في تحليل الأداء. أخبرنا عن سبب تعرضه للقصف من قبل الإحصائيات الرياضية الحديثة.

. — .


, . « ». , , , . – . , , , . 

« » — . . , , P-value, . P-value , , . , ( « » ).

  - , . — . - . . P-value , . , . 

, -, , . , – , : , , , . , ! . 

– 0,05. ? , 30- , , – , — . 20 , , , .

0,05. — , . Qwerty, , . Qwerty .

. 80- , , . – . , , - , , – «false positive». . , , – «false negative». 

0.2. . : «, , , , . – 0.05. ». , , 0.2 – , , .

: «, , , , , . , , 0.2, ». , . , . -, . , ? 

, , - . 

. , , , , , . . . 

, – . , . P-value. – P-value , 0.05. 0.049 0.051, : «! !». 

0.9, , . «» , 20 , P-value , . , . 

, . , – -, , . , . - , , , .

— -. — , -. 

: ? -, -, P-value . : «, - , , ». , . , – . 

– , .  

, , , . 

, : « ?» ( ), : « !».

– 0 1. . , . , , , , , . . – . : « » « - » — . 

. — ? -, , . ; , – P-value – . 

, . 

, , - — « , . ». , . . . — -, , . , , P-value, — , ! - .

, . , , . 

, , . , . . « - , , , , ».


— -, , . , . , — - .

وخطاب آخر لأندريه ، حيث تحدث عن المشكلة بمزيد من التفصيل:




All Articles