نویسنده(های): ایگور نوویکوف
در ابتدا منتشر شد به سمت هوش مصنوعی.
من شرط میبندید در مورد انحراف معیار شنیدهاید، اما معنی آن چیست؟
در اینجا توضیحی وجود دارد که حتی سگ شما نیز می تواند آن را درک کند.
اسانحراف استاندارد ارتباط نزدیکی با واریانس. واریانس، به اندازه کافی تعجب آور نیست، اندازه گیری واریانس مقادیر در یک معین است مجموعه داده. این نشان می دهد که آیتم های مختلف (یا مشابه) در گروه چقدر هستند. به عنوان مثال، به طور متوسط قد یک مرد 174 سانتی متر است. اما اگر یک شخص تصادفی را در خیابان متوقف کنید – قد او احتمالاً متفاوت است. بنابراین، به عنوان مثال برای محله خود، اگر مقدار مشخصی از یاران را متوقف کنید (مثلاً ده نفر) – می توانید واریانس ارتفاعات را محاسبه کنید. می توان آن را به این صورت محاسبه کرد (فرمول را کمی بعد توضیح خواهم داد):
D(X) =جمع (xi-میانگین)²/n،
کجا:
- n – تعداد عناصر (ده)،
- xi – قد شخص شماره i
بنابراین، بیایید قد ده نفری را که ملاقات کردیم به شرح زیر فرض کنیم:
1: 172
2: 163
3: 154
4: 181
5: 190 (lucky dude)
6: 170
7: 174 (average Joe)
8: 168
9: 178
10: 160
حالا بیایید واریانس را محاسبه کنیم. اول، میانگین همه مقادیر است:
متوسط = (172 + 163 + 154 + 181 + 190 + 170 + 174 + 168 + 171 + 160)/10 = 171 سانتی متر
همانطور که می بینید افراد محله ما تا حدودی کوتاهتر از میانگین کشور هستند… احتمالاً در سالهای نوجوانی بیش از حد سیگار می کشیدند یا چیزی مشابه. حالا بیایید ببینیم که مردان محله ما چقدر با هم تفاوت دارند – قد آنها چقدر شبیه است. برای آن باید واریانس را محاسبه کنیم:
- (172–171)²= 1²=1
- (163–171)²= -8²=64
- (154–171)²= -17²=289
- (181–171)²= 10²=100
- (190–171)²= 19²=361
- (170–171)²= -1²=1
- (174–171)²= 3²=9
- (168–171)²=-3²=9
- (178–171)²=7²=49
- (160–171)²=-11²=121
تفاوت بین میانگین و قد یک شخص خاص این است که واریانس چیست، اما چرا آن را مربع می کنیم؟
خوب، ما این کار را انجام می دهیم زیرا در غیر این صورت، می توانیم یک عدد منفی به دست آوریم (اگر شخص فعلی کمتر از میانگین باشد). از نظر درک تغییرپذیری اعداد منفی معنی ندارند، بنابراین آن را مربع می کنیم تا معیار همیشه مثبت شود.
حالا بیایید مجموع را محاسبه کنیم:
1 + 64 + 289 + 100 + 361 + 1 + 9 + 9 + 49 + 121 = 1004
و واریانس = 1004/10 = 100.4.
اما اینجا به چه معناست؟ و از چه واحدهایی استفاده می کند؟ خوب، از آنجایی که ما اختلاف را مجذور کردیم – بدیهی است که از واحدهای اصلی (سانتی متر) استفاده نمی کند. و به همین دلیل تفسیر آن دشوار است … بنابراین در اینجا انحراف معیار می آید، ما به سادگی جذر واریانس را می گیریم (برای معکوس کردن مربع):
انحراف استاندارد (std) = مربع_ریشه (100.4) = 10 سانتی متر
حالا سانتی متر است! درک آن بسیار ساده تر است، و به این معنی است که به طور متوسط، قد مردان متوسط در محله ما 10 سانتی متر متفاوت است (کوچکتر یا بزرگتر) از میانگین قد. به طور متوسط - مهم است اما برای یک شخص خاص ممکن است متفاوت باشد.
بنابراین، انحراف معیار به عنوان معیاری از میزان تغییرات مقادیر یک متغیر در مورد میانگین آن تعریف می شود. اکنون می توانید بفهمید که واقعاً چه معنایی دارد.
ویژگی مهم انحراف معیار این است که در عادی توزیع، حدود 95 درصد مقادیر در 2 انحراف استاندارد از میانگین خواهد بود. این بدان معناست که در مثال ما 95 درصد از مردان همسایه ما قدی در محدوده قد خواهند داشت 171 ± 20 سانتی متر (2*10). و 99.7٪ (تقریبا همه) در 3 انحراف استاندارد خواهند بود. این بدان معناست که افراد با ارتفاع 2 متر بسیار نادر هستند (و آنها نامیده می شوند موارد پرت، زیرا آنها خارج از سه انحراف استاندارد قرار دارند).
عادی توزیع (که گاوسی نیز نامیده می شود) برای اهداف عملی مهم ترین است. زنگی شکل است (به زیر مراجعه کنید) و بیشتر طبیعی و اجتماعی پدیده ها در زندگی واقعی با توزیع نرمال مطابقت دارند. چرا؟ هیچ ایده ای نیست، این فقط یک واقعیت است. من حدس میزنم که جهان از تقارن یا چیزهای دیگر خوشش میآید.
بنابراین امیدواریم اکنون بتوانید انحراف معیار را بهتر درک کنید. از آن لذت ببرید!
منتشر شده از طریق به سمت هوش مصنوعی
منبع: https://towardsai.net/p/machine-learning/standard-deviation-for-dummies