تسلط بر مقیاس داده ها: تنها راهنمای شما (مستقیم از سفر من)


نویسنده(های): سورج جا

در ابتدا منتشر شد به سمت هوش مصنوعی.

چگونه در نهایت مقیاس داده را غلبه کردم: از تجربه دنیای واقعی من بیاموزید

این داستان فقط برای اعضا در اختیار ماست. برای دسترسی به تمام Medium ارتقا دهید.

تصویر توسط نویسنده

مقیاس بندی یکی از مراحل اساسی در پیش پردازش داده ها است.

زمانی که ما به خصوص با a کار می کنیم یک امر ضروری می شود مجموعه داده که به عنوان ورودی برای کار می کند یادگیری ماشینی مدل ها

مقیاس بندی داده های خام را به فرمت مناسبی تبدیل می کند که یادگیری ماشینی مدل ها می توانند درک کنند.

از بهبود عملکرد گرفته تا اطمینان از مقایسه معنادار بین ویژگی ها، همه چیز را به خوبی مدیریت می کند.

بیایید شاهد جادوی مقیاس گذاری در پاکسازی داده ها و پیش پردازش داده ها باشیم.

بهتر است آن را با یک مثال واقعی درک کنید.

تصور کنید یک دارید مجموعه داده که یکی از ویژگی های آن سن (از 0 تا 60 سال) و ویژگی دیگر درآمد سالانه آنها (از 10000 دلار تا 5000000 دلار) است.

الگوریتم های ML مانند شیب نزول با این نوع ویژگی مبارزه کنید زیرا ویژگی‌های مقیاس بزرگ اغلب بر فرآیند بهینه‌سازی تسلط دارند. در نهایت منجر به نتایج ناهنجار می شود.

مقیاس‌گذاری اطمینان حاصل می‌کند که مدل‌های ML با همه ویژگی‌ها یکسان برخورد می‌کنند، زیرا به این ترتیب می‌توانیم دقت و سرعت همگرایی مدل را افزایش دهیم.

یک نوع مقیاس بندی همه مشکلات را حل نمی کند، بنابراین ما چهار نوع روش مقیاس بندی داریم.

زمانی مفید است که ما محدوده (مقادیر حداقل و حداکثر) داده ها را بدانیم و بخواهیم رابطه بین… وبلاگ کامل را به صورت رایگان در Medium بخوانید.

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/artificial-intelligence/mastering-data-scaling-the-only-guide-youll-ever-need-straight-from-my-journey

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *