نفرین ابعاد: چرا بیشتر در یادگیری ماشینی همیشه بهتر نیست؟


نویسنده(ها): سورادیپ پال

در ابتدا منتشر شد به سمت هوش مصنوعی.

این داستان فقط برای اعضا در اختیار ماست. برای دسترسی به تمام Medium ارتقا دهید.

در جهان از یادگیری ماشینی، شما اغلب تا زانو هستید مجموعه داده ها. اینها مجموعه داده ها می تواند هر چیزی باشد – مجموعه ای از قیمت مسکن، ارقام دست نویس، یا حتی جزئیات مربوط به مسافران کشتی تایتانیک. برای پیش‌بینی دقیق، به ویژگی‌ها یا ابعاد این مجموعه داده‌ها تکیه می‌کنید. اما نکته مهم اینجاست: گاهی اوقات داشتن ویژگی های زیاد می تواند یک سردرد واقعی باشد. اینجاست که “نفرین ابعاد” وارد بازی می شود.

عکس از Cederic Vandenberghe در Unsplash

حالا، قبل از اینکه فکر کنید این نفرین متعلق به یک کتاب هری پاتر است، اجازه دهید به شما اطمینان دهم – این موضوع بسیار بر اساس واقعیت است. اصطلاح “نفرین ابعاد” در سال 1957 توسط ریچارد بلمن ابداع شد. اساساً، توضیح می‌دهد که چگونه با اضافه کردن ویژگی‌ها (یا ابعاد) بیشتر به مجموعه داده‌های خود، همه چیز به طور تصاعدی پیچیده‌تر می‌شود. ابعاد بیشتر ممکن است چیز خوبی به نظر برسد، اما به من اعتماد کنید، همیشه به این سادگی نیست.

بیایید این را با یک قیاس ساده بشکنیم. تصور کنید یک دانش آموز هستید و به کلاس می روید و ناگهان متوجه می شوید که کیف پول خود را گم کرده اید (اوه، بدترین). اکنون، شما سه گزینه برای مکان جستجو دارید: یک جاده یک بعدی، یک رشته دو بعدی، و یک ساختمان کالج سه بعدی…. وبلاگ کامل را به صورت رایگان در Medium بخوانید.

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/artificial-intelligence/the-curse-of-dimensionality-why-more-isnt-always-better-in-machine-learning

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *