ุชุทุจูŠุน ุงู„ุจูŠุงู†ุงุช ุงู„ุฐูƒูŠุฉ

ุธู‡ุฑ ู‡ุฐุง ุงู„ู…ู‚ุงู„ ู„ุนุฏุฉ ุฃุณุจุงุจ.



ุฃูˆู„ุงู‹ ุŒ ููŠ ุงู„ุบุงู„ุจูŠุฉ ุงู„ุนุธู…ู‰ ู…ู† ุงู„ูƒุชุจ ูˆู…ูˆุงุฑุฏ ุงู„ุฅู†ุชุฑู†ุช ูˆุงู„ุฏุฑูˆุณ ููŠ ุนู„ูˆู… ุงู„ุจูŠุงู†ุงุช ุŒ ู„ุง ูŠุชู… ุงู„ู†ุธุฑ ููŠ ุงู„ูุฑูˆู‚ ุงู„ุฏู‚ูŠู‚ุฉ ูˆุงู„ุนูŠูˆุจ ููŠ ุงู„ุฃู†ูˆุงุน ุงู„ู…ุฎุชู„ูุฉ ู„ุชุทุจูŠุน ุงู„ุจูŠุงู†ุงุช ูˆุฃุณุจุงุจู‡ุง ุนู„ู‰ ุงู„ุฅุทู„ุงู‚ ุŒ ุฃูˆ ูŠุชู… ุฐูƒุฑู‡ุง ูู‚ุท ุจุดูƒู„ ุนุงุจุฑ ูˆุฏูˆู† ุงู„ูƒุดู ุนู† ุงู„ุฌูˆู‡ุฑ.



ุซุงู†ูŠู‹ุง ุŒ ู‡ู†ุงูƒ ุงุณุชุฎุฏุงู… "ุฃุนู…ู‰" ุŒ ุนู„ู‰ ุณุจูŠู„ ุงู„ู…ุซุงู„ ุŒ ู„ู„ุชูˆุญูŠุฏ ุงู„ู‚ูŠุงุณูŠ ู„ู„ู…ุฌู…ูˆุนุงุช ุฐุงุช ุนุฏุฏ ูƒุจูŠุฑ ู…ู† ุงู„ู…ูŠุฒุงุช - "ุจุญูŠุซ ูŠูƒูˆู† ู‡ูˆ ู†ูุณู‡ ุจุงู„ู†ุณุจุฉ ู„ู„ุฌู…ูŠุน". ุฎุงุตุฉ ู„ู„ู…ุจุชุฏุฆูŠู† (ูƒุงู† ู‡ูˆ ู†ูุณู‡). ู„ู„ูˆู‡ู„ุฉ ุงู„ุฃูˆู„ู‰ ุŒ ู„ุง ุจุฃุณ. ูˆู„ูƒู† ุนู†ุฏ ุงู„ูุญุต ุงู„ุฏู‚ูŠู‚ ุŒ ู‚ุฏ ูŠุชุถุญ ุฃู† ุจุนุถ ุงู„ุนู„ุงู…ุงุช ู‚ุฏ ูˆูุถุนุช ุฏูˆู† ูˆุนูŠ ููŠ ูˆุถุน ู…ุชู…ูŠุฒ ูˆุจุฏุฃุช ููŠ ุงู„ุชุฃุซูŠุฑ ุนู„ู‰ ุงู„ู†ุชูŠุฌุฉ ุจู‚ูˆุฉ ุฃูƒุจุฑ ู…ู…ุง ูŠู†ุจุบูŠ.



ูˆุซุงู„ุซู‹ุง ุŒ ูƒู†ุช ุฃุฑุบุจ ุฏุงุฆู…ู‹ุง ููŠ ุงู„ุญุตูˆู„ ุนู„ู‰ ุทุฑูŠู‚ุฉ ุนุงู„ู…ูŠุฉ ุชุฃุฎุฐ ููŠ ุงู„ุงุนุชุจุงุฑ ู…ู†ุงุทู‚ ุงู„ู…ุดูƒู„ุงุช.





ุงู„ุชูƒุฑุงุฑ ุฃู… ุงู„ุชุนู„ู…



ุงู„ุชุทุจูŠุน ู‡ูˆ ุชุญูˆูŠู„ ุงู„ุจูŠุงู†ุงุช ุฅู„ู‰ ูˆุญุฏุงุช ู…ุนูŠู†ุฉ ุจู„ุง ุฃุจุนุงุฏ. ููŠ ุจุนุถ ุงู„ุฃุญูŠุงู† - ุถู…ู† ู†ุทุงู‚ ู…ุนูŠู† ุŒ ุนู„ู‰ ุณุจูŠู„ ุงู„ู…ุซุงู„ ุŒ [0..1] ุฃูˆ [-1..1]. ููŠ ุจุนุถ ุงู„ุฃุญูŠุงู† - ู…ุน ุจุนุถ ุงู„ุฎุตุงุฆุต ุงู„ู…ุนุทุงุฉ ุŒ ู…ุซู„ ุŒ ุนู„ู‰ ุณุจูŠู„ ุงู„ู…ุซุงู„ ุŒ ุงู„ุงู†ุญุฑุงู ุงู„ู…ุนูŠุงุฑูŠ ู„ู€ 1.



ุงู„ู‡ุฏู ุงู„ุฑุฆูŠุณูŠ ู…ู† ุงู„ุชุณูˆูŠุฉ ู‡ูˆ ุฅุญุถุงุฑ ุจูŠุงู†ุงุช ู…ุฎุชู„ูุฉ ููŠ ู…ุฌู…ูˆุนุฉ ู…ุชู†ูˆุนุฉ ู…ู† ุงู„ูˆุญุฏุงุช ูˆู†ุทุงู‚ุงุช ุงู„ู‚ูŠู… ุฅู„ู‰ ู†ู…ูˆุฐุฌ ูˆุงุญุฏ ูŠุณู…ุญ ู„ูƒ ุจู…ู‚ุงุฑู†ุชู‡ุง ู…ุน ุจุนุถู‡ุง ุงู„ุจุนุถ ุฃูˆ ุงุณุชุฎุฏุงู…ู‡ุง ู„ุญุณุงุจ ุชุดุงุจู‡ ุงู„ูƒุงุฆู†ุงุช. ู…ู† ุงู„ู†ุงุญูŠุฉ ุงู„ุนู…ู„ูŠุฉ ุŒ ูŠุนุฏ ู‡ุฐุง ุถุฑูˆุฑูŠู‹ุง ุŒ ุนู„ู‰ ุณุจูŠู„ ุงู„ู…ุซุงู„ ุŒ ู„ู„ุชุฌู…ูŠุน ูˆููŠ ุจุนุถ ุฎูˆุงุฑุฒู…ูŠุงุช ุงู„ุชุนู„ู… ุงู„ุขู„ูŠ.



ู…ู† ุงู„ู†ุงุญูŠุฉ ุงู„ุชุญู„ูŠู„ูŠุฉ ุŒ ูŠุชู… ุชู‚ู„ูŠู„ ุฃูŠ ุชุทุจูŠุน ุฅู„ู‰ ุงู„ุตูŠุบุฉ



Xู†ุญูˆู„ุฑู…=(Xุฃู†ุง-Xู…ู† ุนู†ุฏู…ู‡ุด)/Xู‡ุฏ



ุฃูŠู† Xุฃู†ุง - ุงู„ู‚ูŠู…ุฉ ุงู„ุญุงู„ูŠุฉุŒ

Xู…ู† ุนู†ุฏู…ู‡ุด - ู‚ูŠู…ุฉ ู‚ูŠู… ุงู„ุฅุฒุงุญุฉ ุŒ

Xู‡ุฏ - ุญุฌู… ุงู„ูุงุตู„ ุงู„ุฒู…ู†ูŠ ุงู„ู…ุทู„ูˆุจ ุชุญูˆูŠู„ู‡ ุฅู„ู‰ "ูˆุงุญุฏ"



ููŠ ุงู„ูˆุงู‚ุน ุŒ ูƒู„ ู‡ุฐุง ูŠุชู„ุฎุต ููŠ ุญู‚ูŠู‚ุฉ ุฃู† ู…ุฌู…ูˆุนุฉ ุงู„ู‚ูŠู… ุงู„ุฃุตู„ูŠุฉ ู‚ุฏ ุชู… ุฅุฒุงุญุชู‡ุง ุฃูˆู„ุงู‹ ุซู… ู‚ูŠุงุณู‡ุง.



ุฃู…ุซู„ุฉ:



ู…ูŠู†ูŠู…ุงูƒุณ (ู…ูŠู†ู…ุงูƒุณ) . ุงู„ู‡ุฏู ู‡ูˆ ุชุญูˆูŠู„ ุงู„ู…ุฌู…ูˆุนุฉ ุงู„ุฃุตู„ูŠุฉ ุฅู„ู‰ ุงู„ู†ุทุงู‚ [0..1]. ู„ู‡:

Xู…ู† ุนู†ุฏู…ู‡ุด= Xู…ูˆู†, .

Xู‡ุฏ = Xู…ูˆุฅู„ู‰ู…ู† ุนู†ุฏ โ€” Xู…ูˆู†, .. โ€œโ€ .



. โ€” 0 1.

Xู…ู† ุนู†ุฏู…ู‡ุด= Xู…ู† ุนู†ุฏุฑ, .

Xู‡ุฏ โ€” .



, .



, , โ€œโ€ . .



, - . , . , , . , . , โ€” . , , , , *



* โ€” , , ( ), , .



, โ€” .



1 โ€”



โ€” .. , , 0 โ€œโ€ .



? ยซ ยป . .



โ„– 1 โ€” , .



, โ€œ โ€ , , โ€” , . ( ). ( ) .



, , .







:





. โ€œโ€ .



, , , . .



2 โ€”



. .



. , , [-1..1], . [-1..1], โ€” [-1..100], , . .





. . , โ€œโ€.



( ):







( ) , .







, () โ€œโ€, .







โ€” ( ). , โ€œโ€ .





75- 25- โ€” . .. , โ€œโ€ 50% . โ€œโ€ / .



โ€” โ€œโ€, โ€œโ€ .



โ„– 2 โ€” โ€œโ€ .



โ€” .







( ).







- โ€œโ€ . , , โ€œโ€.





. .. . โ€” 1.



, , , โ„– 3 โ€” . ( ) .



, , . 2-













, , . .





, โ€œ-โ€. โ€” .



โ€” , . , . , , , , ? .



, . , โ€œโ€ , 1,5 (IQR) .*



* โ€” ( .) 1,5 3 โ€” .



.







โ€” - , .



. (, , ) โ€œโ€ โ€” 7%. (3 * IQR) โ€” . . .. .



, . โ€œ โ€ (1,5 * IQR) , . , - โ€œโ€ .









(Mia Hubert and Ellen Vandervieren) 2007 . โ€œAn Adjusted Boxplot for Skewed Distributionsโ€.



โ€œ โ€ , 1,5 * IQR.



โ€œ โ€ medcouple (MC), :









โ€œ โ€ , , , 1,5 * IQR โ€” 0,7%



:



ู…ุฌ> =0:







ู…ุฌ<0:







. .





, , :



  1. , , .
  2. .
  3. () โ€” , , [0..1]


โ€ฆ โ€” Mia Hubert Ellen Vandervieren



. .







, ( ) (MinMax โ€” ).



โ„– 1 โ€” . . , โ€œโ€ .



:







( ):







:







, โ€” , , .



โ„– 2 โ€” . [0..1]. , , .



MinMax ( ):







:







. -, , โ€” .. 0 1.



, โ€œโ€ [0..1], , โ€” , , , . .





* * *





ุฃุฎูŠุฑู‹ุง ุŒ ู„ุฅุชุงุญุฉ ุงู„ูุฑุตุฉ ู„ู„ุดุนูˆุฑ ุจู‡ุฐู‡ ุงู„ุทุฑูŠู‚ุฉ ุจูŠู† ูŠุฏูŠูƒ ุŒ ูŠู…ูƒู†ูƒ ุชุฌุฑุจุฉ ุงู„ูุตู„ ุงู„ุชุฌุฑูŠุจูŠ ุงู„ุฎุงุต ุจูŠ AdjustedScaler ู…ู† ู‡ู†ุง .



ู„ู… ูŠุชู… ุชุญุณูŠู†ู‡ ู„ู„ุนู…ู„ ู…ุน ูƒู…ูŠุฉ ูƒุจูŠุฑุฉ ุฌุฏู‹ุง ู…ู† ุงู„ุจูŠุงู†ุงุช ูˆูŠุนู…ู„ ูู‚ุท ู…ุน pandas DataFrame ุŒ ูˆู„ูƒู† ู„ู„ุชุฌุฑุจุฉ ุฃูˆ ุงู„ุชุฌุฑูŠุจ ุฃูˆ ุญุชู‰ ูุงุฑุบู‹ุง ู„ุดูŠุก ุฃูƒุซุฑ ุฎุทูˆุฑุฉ ุŒ ูู‡ูˆ ู…ู†ุงุณุจ ุชู…ุงู…ู‹ุง. ุฌุฑุจู‡ุง.




All Articles