هذه المقالة مخصصة. و آخر مرة نظرت إلى الفروق الدقيقة والتحديات من مختلف وسائل تطبيع البيانات. وفقط بعد النشر أدركت أنني لم أذكر بعض التفاصيل المهمة. بالنسبة للبعض ، ستبدو واضحة ، لكن في رأيي ، من الأفضل التحدث عنها صراحة.
تطبيع البيانات الفئوية
لكي لا نشوش النص بالأشياء الأساسية ، سأفترض أنك تعرف ما هي البيانات الفئوية والترتيبية ، وكيف تختلف عن البقية.
من الواضح أن أي تسوية لا يمكن إجراؤها إلا على البيانات الرقمية. وفقًا لذلك ، إذا كانت الأرقام مناسبة فقط للخوارزمية / البرنامج الخاص بك لمزيد من العمل ، فمن الضروري تحويل جميع الأنواع الأخرى إليها.
البيانات الفئوية بسيطة. إذا لم يكن الهدف مجرد تشفير (تشفير) القيم ببعض الأرقام ، فإن الخيار الوحيد المتاح هو تمثيلها كقيم "1" - "0" (نعم - لا) لكل فئة ممكنة. هذا هو ما يسمى ترميز واحد ساخن . عندما ، بدلاً من ميزة فئوية واحدة ، تظهر العديد من الميزات "المنطقية" الجديدة نظرًا لوجود فئات محتملة.

و هذا كل شيء.
لا حسابات وسيطة أو حسابية ، ولا تعويضات.
إذا كنت تقوم بإعداد البيانات لإدخال شبكة عصبية ، فهذا هو بالضبط ما تحتاجه.
من المهم أن نفهم أن تطبيق التحولات مثل التوحيد القياسي على السمات الفئوية / "المنطقية" هو على الأقل عديم الفائدة ، وضررًا على الأكثر. لأنه يمكن أن يزيد أو ينقص نطاق قيمها بشكل غير معقول. كتبت بمزيد من التفصيل عن أهمية المساواة بين هذه الفترات في المرة الماضية.
, , , , “” “”. “ ”, , “” . , , — .
, - , « , 0 1». , . , .
. “” ( ) . , . .
1. . ( ). ( ) , , , . , , .

2. ( ). , “” .
, , . — , , , .
— ..

“”
, , . , .
. “” , . “” .
. , , , . — , , , ( ). .
“” , “”. .

. . , , 100 , 100 . 100 .
,

. “” , , . - , .
“” ( ) “” .

, , “”. .
“” “” .
. /, . “-” ( ), “-” ( ). , - , “-” , “-”.

. . “” .
, , (- ), “-”, , “-”, . .. “”.
, “”, .
, — - , . - .
P.S. — , - AdjustedScaler, “” .