كيف أقوم بتحسين دقة نماذج التدريب الخاصة بي بانتظام من 80٪ إلى 90 +٪

استعدادًا لبدء الدورة التدريبية الأساسية حول التعلم الآلي ، أعددنا ترجمة ممتعة لك ، ونقدم لك أيضًا مشاهدة درس تجريبي مجاني حول موضوع: "كيف تبدأ في جعل العالم مكانًا أفضل باستخدام البرمجة اللغوية العصبية" .


المقدمة

إذا كنت قد أكملت على الأقل عددًا قليلاً من مشاريع علوم البيانات الخاصة بك ، فمن المحتمل أنك اكتشفت بالفعل أن دقة 80٪ ليست بهذا السوء. لكن بالنسبة للعالم الحقيقي ، 80٪ لم يعد مناسبًا. في الواقع ، تتوقع معظم الشركات التي عملت بها حدًا أدنى من الدقة (أو أي مقياس تنظر إليه) بنسبة 90٪ على الأقل.

لذلك ، سأتحدث عن خمسة أشياء يمكنك القيام بها لتحسين الدقة بشكل ملحوظ. أوصي بشدة بقراءة جميع النقاط الخمس نظرًا لوجود العديد من التفاصيل التي قد لا يعرفها المبتدئين.

, , , , .

, 5 , , !

1.

, , , , . , /, , .

, , , , , . 15 80 , 80 , .

, , « »?

, / :

  • : , , . , , ANOVA .

  • K- : K- , , , K- (.. ).

  • : , . , , .

2.

– . – , , . , Data Science – , . , , :

  • DateTime , , ..

  • (, 100–149, 150–199, 200–249 ..)

  • / . , «Iswomenor_child», True, , False .

3.

– , / . , , , .

, :

  • : , XGBoost, , «» . , , .

  • : – (PCA). .

4. Ensemble Learning

– . , . 

(Ensemble Learning) – , . , , - .

- , XGBoost, AdaBoost. , , :

. () . ? « , », .

, , , 0. 4 , 1. !

5.

, , , – . , , , , .

:

class sklearn.ensemble.RandomForestClassifier(n_estimators=100, *, criterion='gini', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features='auto', max_leaf_nodes=None, min_impurity_decrease=0.0, min_impurity_split=None, bootstrap=True, oob_score=False, n_jobs=None, random_state=None, verbose=0, warm_start=False, class_weight=None, ccp_alpha=0.0, max_samples=None

, , minimpuritydecrease, , «», ! ;)

, 80% 90+%. . Data Science.


, , .

:




All Articles