تطبيع البيانات الذكية: بيانات فئوية وترتيبية ، ميزات "مزدوجة"

هذه المقالة مخصصة. و آخر مرة نظرت إلى الفروق الدقيقة والتحديات من مختلف وسائل تطبيع البيانات. وفقط بعد النشر أدركت أنني لم أذكر بعض التفاصيل المهمة. بالنسبة للبعض ، ستبدو واضحة ، لكن في رأيي ، من الأفضل التحدث عنها صراحة.



تطبيع البيانات الفئوية



لكي لا نشوش النص بالأشياء الأساسية ، سأفترض أنك تعرف ما هي البيانات الفئوية والترتيبية ، وكيف تختلف عن البقية.



من الواضح أن أي تسوية لا يمكن إجراؤها إلا على البيانات الرقمية. وفقًا لذلك ، إذا كانت الأرقام مناسبة فقط للخوارزمية / البرنامج الخاص بك لمزيد من العمل ، فمن الضروري تحويل جميع الأنواع الأخرى إليها.



البيانات الفئوية بسيطة. إذا لم يكن الهدف مجرد تشفير (تشفير) القيم ببعض الأرقام ، فإن الخيار الوحيد المتاح هو تمثيلها كقيم "1" - "0" (نعم - لا) لكل فئة ممكنة. هذا هو ما يسمى ترميز واحد ساخن . عندما ، بدلاً من ميزة فئوية واحدة ، تظهر العديد من الميزات "المنطقية" الجديدة نظرًا لوجود فئات محتملة.





و هذا كل شيء.



لا حسابات وسيطة أو حسابية ، ولا تعويضات.



إذا كنت تقوم بإعداد البيانات لإدخال شبكة عصبية ، فهذا هو بالضبط ما تحتاجه.



من المهم أن نفهم أن تطبيق التحولات مثل التوحيد القياسي على السمات الفئوية / "المنطقية" هو على الأقل عديم الفائدة ، وضررًا على الأكثر. لأنه يمكن أن يزيد أو ينقص نطاق قيمها بشكل غير معقول. كتبت بمزيد من التفصيل عن أهمية المساواة بين هذه الفترات في المرة الماضية.



, , , , “” “”. “ ”, , “” . , , — .



, - , « , 0 1». , . , .





. “” ( ) . , . .



1. . ( ). ( ) , , , . , , .





2. ( ). , “” .



, , . — , , , .



— ..





“”



, , . , .



. “” , . “” .



. , , , . — , , , ( ). .



“” , “”. .





. . , , 100 , 100 . 100 .



,





. “” , , . - , .



“” ( ) “” .





, , “”. .





“” “” .



. /, . “-” ( ), “-” ( ). , - , “-” , “-”.





. . “” .



, , (- ), “-”, , “-”, . .. “”.



, “”, .



, — - , . - .



P.S. — , - AdjustedScaler, “” .




All Articles