

تصویر نویسنده | ایدئوگرام
5 کتاب رایگان در کامپیوتر ویژن
بینایی کامپیوتر شاخه ای از هوش مصنوعی (AI) است که مطالعه می کند چگونه ماشین ها می توانند اطلاعات بصری، مانند تصاویر و ویدئوها را تفسیر و درک کنند. امروزه اکثر مدلهای بینایی کامپیوتری مبتنی بر معماریهای یادگیری عمیق مانند شبکههای عصبی کانولوشنال (CNN) هستند که در وظایفی مانند طبقهبندی تصویر، تشخیص اشیا و تقسیمبندی برتری دارند. با این حال، مبانی لازم برای درک عمیق این رشته به زمان های قبلی باز می گردد.
برای کمک به شما در تسلط بر این حوزه بسیار کاربردی هوش مصنوعی، این پست پنج کتاب را فهرست میکند که میتوانید بدون هیچ هزینهای بخوانید: متون کلاسیک برای کسب مبانی نظری و یادگیری تکنیکهای مرسوم، و موارد جدیدتر که مدلهای پیشرفتهای مانند شبکههای عصبی عمیق را پوشش میدهند.
1. بینایی کامپیوتر: الگوریتمها و کاربردها (R. Szeliski)
این کتاب بینایی کامپیوتر منتشر شده توسط Springer را می توانید از فروشگاه های اینترنتی بزرگ خریداری کنید. با این وجود، می توان آن را از سایت دانلود کرد وب سایت نویسنده بدون هیچ هزینه ای فقط برای استفاده شخصی این منبع با بیش از 1200 صفحه، منبعی کلیدی در زمینه بینایی کامپیوتر است که مجموعه وسیعی از موضوعات و برنامه ها را پوشش می دهد: تشخیص اشیا، پردازش تصویر، بازسازی سه بعدی، تجزیه و تحلیل حرکت و موارد دیگر.
2. بینایی کامپیوتر: مدلها، یادگیری و استنتاج (SJD Prince)
یک متن مرجع کلاسیک برای دانلود در دسترس است اینجا، مقدمه ای جامع برای بینایی کامپیوتر ارائه می دهد و بر مفاهیم اصلی مدل ها و تکنیک های یادگیری ماشینی مورد استفاده در اکثر سیستم های بینایی کامپیوتری تاکید می کند. همچنین مقدمهای عمیق بر مدلهای احتمالی و نموداری، کلیدی برای بسیاری از رویکردهای بینایی کامپیوتری را پوشش میدهد.
3. چشم انداز کامپیوتر: مبانی و کاربردها (یادداشت های دوره استنفورد)
این مجموعه عالی که توسط Rankay Krishna ساخته شده است، یادداشت های سخنرانی از دوره همنام دانشگاه استنفورد را گرد هم می آورد. خواندن مختصرتر اما جامعتر بر ابهامزدایی از مفاهیم و تعاریف در این زمینه متمرکز بود. نسخه pdf را می توان در بخش چشم انداز استانفورد مشاهده کرد اینجا.
4. برنامه نویسی کامپیوتر ویژن با پایتون (JE Solem)
این کتاب تحت مجوز Creative Commons تمرکز را به اجرای عملی سیستمهای بینایی کامپیوتری در پایتون، با استفاده از رویکردها و کتابخانههای سنتی تغییر میدهد. از صفحه 1، به نمونههای مبتنی بر پایتون برای پردازش تصویر میپردازد و به دنبال آن برنامههای مختلفی مانند واقعیت افزوده، خوشهبندی تصویر، و طبقهبندی تصویر قرار میگیرد. این کتاب تکنیکهای بینایی کامپیوتری سنتی را بدون شبکههای عصبی و معماریهای یادگیری عمیق درگیر میکند و در عوض بر روی ریاضیات، هندسه و رویکردهای یادگیری ماشین کلاسیک تمرکز میکند.
5. Deep Learning، MIT Press (I. Godfellow et al.)
کتاب معروف Deep Learning منتشر شده توسط MIT Press را نمی توان برای توزیع در قالب PDF دانلود کرد، اما فصل های آن برای خواندن در قالب HTML در کتاب در دسترس عموم است. وب سایت. اگرچه این کتاب صرفاً بر روی بینایی رایانه متمرکز نیست، اما فصلهای ضروری برای درک سیستمهای بینایی مدرن مبتنی بر معماری CNN (فصل 9)، برنامههای بینایی رایانه (فصل 12) و مدلسازی احتمالی دادههای بدون ساختار مانند تصاویر (فصل 16) ارائه میکند. چند. این فصلها پس از کسب مبانی بینایی کامپیوتر از طریق کتابهای فهرستشده قبلی، یک پیگیری ایدهآل برای خوانندگان پیشرفته است.