نویسنده(های): جوزف رابینسون، Ph.D.
در ابتدا منتشر شد به سمت هوش مصنوعی.
با این مسابقه پاپ علم داده، اصول را مرور کنید، مهارت های خود را تقویت کنید، و مصاحبه را انجام دهید!
این داستان فقط برای اعضا در اختیار ماست. برای دسترسی به تمام Medium ارتقا دهید.
علم داده ممکن است با توجه به فراوانی آموزشها و کتابخانههای آنلاین که کدنویسی و مدلسازی را ساده میکنند، در دسترس به نظر برسد، اما تخصص واقعی فراتر از آن است – این نیاز به درک عمیق پیچیدگیهای داده، نظریه آماری و تصمیمگیری ظریفی دارد که با ساخت دادهها همراه است. راه حل های مبتنی بر
در زیر هفت سوال برای آزمایش عمق دانش شما در علم داده آورده شده است. اگر نمی توانید با اطمینان به این موارد پاسخ دهید، ممکن است لازم باشد قبل از اینکه خود را یک متخصص بنامید، دو بار فکر کنید
رگرسیون خطی اغلب اولین الگوریتمی است که در دوره های علوم داده تدریس می شود، اما آیا مفروضاتی را که زیربنای اعتبار آن است، درک می کنید؟ در اینجا به برخی از آنها اشاره می کنیم.
خطی بودن: رابطه بین متغیرهای مستقل و وابسته باید خطی باشد. می توان این را با استفاده از نمودارهای پراکنده، نمودارهای باقیمانده یا همبستگی ضرایب (یعنی مقادیر r پیرسون). استقلال: مشاهدات باید مستقل از یکدیگر باشند. یک تابع خودهمبستگی می تواند این را در داده های سری زمانی بررسی کند. Homoscedasticity: واریانس باقیمانده ها باید در تمام سطوح متغیر مستقل ثابت بماند. شما می توانید این را با یک نمودار باقیمانده در مقابل برازش تجسم کنید. نرمال بودن: باقیمانده ها باید به طور معمول توزیع شوند، اغلب با استفاده از نمودار QQ یا با محاسبه چولگی تأیید می شوند… وبلاگ کامل را به صورت رایگان در Medium بخوانید.
منتشر شده از طریق به سمت هوش مصنوعی