جعبه‌ها، ویولن‌ها و کانتورها فرآیند تحلیل داده‌های اکتشافی را به پایان می‌رسانند.


نویسنده(های): چاندرا پراکاش باتولا

در ابتدا منتشر شد به سمت هوش مصنوعی.

این داستان فقط برای اعضا در اختیار ماست. برای دسترسی به تمام Medium ارتقا دهید.

عکس توسط Stefany Andrade در Unsplash

پرداختن به طرح‌های جعبه‌ای، ویولن پلات و طرح‌های کانتور، چیزهای زیادی را در مورد داده‌های قبل نشان می‌دهد. یادگیری ماشینی مدل سازی،

به پایان مقاله برای پیش نیازها خوش آمدید ML مدل سازی

اکنون می‌توانیم با بقیه مفاهیم در این مقاله ادامه دهیم. قبلاً در این مجموعه در مورد Plotting در مقاله اول و تراکم و انحراف در مقاله بعدی صحبت کردیم.

بیایید با جایگزین های میانگین شروع کنیم،

به این معنی که “میانا” را داریم که به سادگی مقدار وسط آرایه است.

print(np.median(iris_setosa[“petal_length”]))#میانگین با چاپ بیرونی(np.median(np.append(iris_setosa[“petal_length”],50)));print(np.median(iris_virginica[“petal_length”]))print(np.median(iris_versicolor[“petal_length”]))

میانه برای Setosa 1.5 است. با نقطه پرت، همچنان در 1.5 یکسان است. اما در مورد میانگین اینطور نیست; تفاوت قابل توجهی وجود دارد. برای Versicolor، Virginica، 5.55 و 4.35 داریم که به میانگین آنها نزدیکتر هستند.

به طور شهودی، این میانه ها بسیار شبیه به میانگین یا گرایش مرکزی آنها هستند، اما این ویژگی خوب را دارد که یک یا چند نقطه به طور قابل توجهی بر مقدار تأثیر نمی گذارد.

فرض کنید هفت مشاهده داریم. X = {1.1،1.2،1،1.2،1.6،2.1،1.8}؛ اجازه دهید مشاهداتی مانند طول کاسبرگ یا طول گلبرگ باشد.

میانه را می توان به صورت زیر محاسبه کرد: مرحله 1:… وبلاگ کامل را به صورت رایگان در Medium بخوانید.

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/artificial-intelligence/boxes-violins-and-contours-conclude-the-exploratory-data-analysis-process