چرا scikit-learn برای تجسم درختان تصمیم بهترین نیست: با dtreeviz آشنا شوید


نویسنده(ها): سورادیپ پال

در ابتدا منتشر شد به سمت هوش مصنوعی.

عاشق شوید درختان تصمیم با تجسم dtreeviz

این داستان فقط برای اعضا در اختیار ماست. برای دسترسی به تمام Medium ارتقا دهید.

درختان تصمیمکه با نام CART (درخت طبقه بندی و رگرسیون) نیز شناخته می شود، بدون شک یکی از بصری ترین الگوریتم ها در یادگیری ماشینی فضا، به لطف سادگی آنها. برخلاف شبکه‌های عصبی یا SVM، که در آن‌ها باید زمان قابل‌توجهی برای درک فرآیندهای اساسی صرف کنید، درخت‌های تصمیم اساساً مجموعه‌ای از عبارات «اگر-دیگر» هستند که در کنار هم قرار گرفته‌اند تا شما را به سمت یک نتیجه ممکن راهنمایی کنند. مطمئناً، مقداری ریاضی در تعیین این شرایط دخیل است، اما خیلی سخت نیست.

بله، درختان تصمیم گیری ساده هستند، اما یک نکته وجود دارد. مشکل در خود الگوریتم نهفته است، بلکه در ابزارهایی است که اغلب برای تجسم آن استفاده می‌شود – به‌ویژه، Sikit-Learn. تجسم‌های تولید شده توسط scikit-learn می‌تواند شما را به‌کلی از درخت‌های تصمیم‌گیری دور کند. چرا این را می گویم؟ خوب، بیایید به یک مثال بپردازیم تا خودتان متوجه شوید.

برای نشان دادن محدودیت ها، از پنگوئن معروف استفاده می کنیم مجموعه داده، که به راحتی در دریازادگان موجود است.

اول از همه، ما باید کتابخانه های لازم را وارد کنیم تا همه چیز رول شود. بیایید تشریفات را از سر راه برداریم:

در اینجا، می بینید که ما تمام کتابخانه های مورد نیاز را وارد کرده ایم. حالا بیایید بارگذاری کنیم مجموعه داده، کدگذاری برچسب را انجام دهید و… وبلاگ کامل را به صورت رایگان در Medium بخوانید.

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/artificial-intelligence/why-scikit-learn-isnt-the-best-for-visualizing-decision-trees-meet-dtreeviz