از یادگیری تحت نظارت تا راهزنان متنی: تکامل تصمیم گیری هوش مصنوعی


نویسنده(های): جوزف رابینسون، Ph.D.

در ابتدا منتشر شد به سمت هوش مصنوعی.

این داستان فقط برای اعضا در اختیار ماست. برای دسترسی به تمام Medium ارتقا دهید.

یادگیری تحت نظارت: یک بار آموزش دهید، مدل استاتیک را استقرار دهید. راهزن های متنی: یک بار استقرار کنید، به عامل اجازه دهید تا اقدامات را بر اساس محتوا و پاداش مربوط به آن تطبیق دهد. نویسنده تصویری ایجاد کرد.

یادگیری تحت نظارت یک عنصر اساسی در آن است یادگیری ماشینی برای مشکلات کاملاً تعریف شده، اما برای انطباق با محیط‌های پویا تلاش می‌کند: وارد راهزن‌های متنی شوید.

این وبلاگ تفاوت های بین یادگیری تحت نظارت و راهزنان متنی را بررسی می کند. از موتورهای شخصی‌سازی گرفته تا قیمت‌گذاری بلادرنگ، راهزن‌های زمینه‌ای با یادگیری مداوم از بازخورد، مزیتی را ارائه می‌کنند.

ما به طور عملی با الگوریتم‌هایی مانند نمونه‌برداری تامپسون و LinUCB کار خواهیم کرد تا بفهمیم چه زمانی و چرا راهزنان متنی از مدل‌های استاتیک سنتی که با نظارت آموزش دیده‌اند، بهتر عمل می‌کنند.

دانستن مدل مناسب برای یک مشکل معین در دنیای داده محور ما ضروری است. یادگیری تحت نظارت برای سال ها بر چشم انداز تسلط داشته است و راه حل های قابل اعتمادی برای مسائل ایستا ارائه می دهد.

اخیراً، راهزن های متنی به عنوان یک جایگزین قدرتمند ظاهر شده اند، زیرا برنامه ها پیچیده تر می شوند و به سیستم هایی نیاز دارند که در زمان واقعی سازگار شوند. آنها یک رویکرد پیچیده برای یادگیری و تصمیم گیری ارائه می دهند، چه توصیه محصولات، تعیین قیمت های پویا، یا بهینه سازی مکان های تبلیغاتی.

اگر چالش‌های شخصی‌سازی کاربر، محیط‌های پویا، یا معاوضه‌های اکتشاف و بهره‌برداری را دنبال می‌کنید، این وبلاگ برای شما مناسب است!

توجه داشته باشید که این قسمت دوم … وبلاگ کامل را به صورت رایگان در Medium بخوانید.

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/machine-learning/from-supervised-learning-to-contextual-bandits-the-evolution-of-ai-decision-making