شماره 55 آیا می خواهید یک پروژه نمونه کار برجسته با جدیدترین مدل ها ایجاد کنید؟


نویسنده(های): به سمت تیم تحریریه هوش مصنوعی

در ابتدا منتشر شد به سمت هوش مصنوعی.

صبح بخیر، علاقه مندان به هوش مصنوعی! این هفته، مجموعه‌ای از آموزش‌های عملی را داریم که برای تقویت پروژه‌های نمونه کار شما عالی هستند. اگر قبلاً آن را بررسی نکرده‌اید، ما همچنین یک دوره آموزشی بسیار عمیق را راه‌اندازی کرده‌ایم که به شما کمک می‌کند تا یک ۶ رقمی بخرید. شغل به عنوان یک LLM توسعه دهنده در اینجا می توانید به پیش نمایش رایگان نگاهی بیندازید.

به علاوه، شماره این هفته مملو از فرصت های همکاری هیجان انگیز، منابع ارزشمند و بحث است. از خواندن لذت ببرید 🙂

هفتگی هوش مصنوعی چیست

تنظیم دقیق رقیبی برای RAG نیست اما می تواند آن را تکمیل کند. با آموزش مدل بر روی داده های خاص، بازیابی اسناد مرتبط تری را نیز پیدا می کند و مولد می تواند پاسخ های دقیق تری بدهد زیرا هر دو موضوع را بهتر درک می کنند. این فرآیند خطاها را کاهش می دهد و پاسخ ها را واضح تر و دقیق تر می کند. تکنیک های مختلفی برای تنظیم دقیق تر مدل شما وجود دارد. این هفته، بیایید برخی از این تکنیک ها را بررسی کنیم و بفهمیم که چگونه می توانند خط لوله RAG شما را بهبود بخشند. مقاله کامل را اینجا بخوانید یا ویدیو را در یوتیوب تماشا کنید!

– لویی فرانسوا بوچارد، بنیانگذار و رئیس انجمن به سوی هوش مصنوعی

بخش جامعه هوش مصنوعی را یاد بگیرید!

نظرسنجی هفته هوش مصنوعی!

من با آن مخالف نیستم، به سوی هوش مصنوعی همه چیز در مورد دسترسی به هوش مصنوعی است. اما، تمام قوانین یادگیری که در مورد هوش مصنوعی اعمال می شود، یادگیری ماشینی، و NLP همیشه اعمال نمی شود LLMsبه خصوص اگر در حال ساخت چیزی هستید یا به دنبال شغلی با درآمد بالا هستید. دانستن آنچه که با LLM امکان پذیر نیست به همان اندازه مهم است که دانستن آنچه ممکن است. و با سرعت توسعه LLM، شما زمان لازم برای اختراع مجدد چرخ را ندارید، اینجاست که من شخصاً در مورد دوره‌های پولی نظارت شده و آزمایش شده پاسخ می‌دهم. دوست دارم نظرات شما را در این مورد بشنوم و بفهمم که چه موانعی برای پرداخت هزینه یک دوره وجود دارد. همه را در تاپیک به اشتراک بگذارید، و بیایید صحبت کنیم!

فرصت های همکاری

انجمن Learn AI Together Discord مملو از فرصت های همکاری است. اگر مشتاق هستید که در هوش مصنوعی کاربردی شیرجه بزنید، یک شریک تحصیلی می خواهید، یا حتی می خواهید شریکی برای پروژه اشتیاق خود پیدا کنید، به کانال همکاری بپیوندید! مراقب این بخش نیز باشید – ما هر هفته فرصت های جالبی را به اشتراک می گذاریم!

1. اورفاوالم در حال توسعه یک برنامه تلفن همراه مبتنی بر هوش مصنوعی برای کمک به افراد دارای معلولیت است و به دنبال یک یا دو توسعه دهنده با تجربه در توسعه برنامه های تلفن همراه و NLP یا بینایی کامپیوتری اگر این برای شما مرتبط و جالب به نظر می رسد، در تاپیک دراز کنید!

2. لوفوفز__ به دنبال 1 تا 2 مهندس برای کار بر روی یک پروژه چند عامله است که در حال جذب است. اگر می خواهید در این مورد بیشتر بدانید، در نخ وصل کنید!

3. شوبهامگور. به دنبال همکاری با کسی است MLپروژه مبتنی بر – یادگیری عمیق، پیتورچ. اگر این به نظر هیجان انگیز است، در تاپیک با آنها تماس بگیرید!

میم هفته!

میم به اشتراک گذاشته شده توسط bigbuxchungus

بخش سرپرستی TAI

مقاله هفته

رمزگشایی متغیرهای پنهان: مقایسه رویکردهای بیزی، EM و VAE توسط شنگانگ لی

این مقاله یک تجزیه و تحلیل جامع از سه روش آماری برای کشف الگوهای پنهان در داده ها ارائه می دهد: حداکثر سازی انتظارات (EM)، تخمین بیزی، و رمزگذارهای خودکار متغیر (VAEs). این نشان می دهد که چگونه هر روش داده های ناقص را مدیریت می کند و الگوهای اساسی را با استفاده از سناریوهای تست A/B در کمپین های بازاریابی نشان می دهد. این مطالعه نشان می‌دهد که چگونه EM به طور مکرر اطلاعات از دست رفته را اصلاح می‌کند، تخمین بیزی دانش قبلی را با داده‌های جدید برای نتایج مطمئن ترکیب می‌کند، و VAEها از شبکه‌های عصبی برای تولید احتمالات جدید و شبیه‌سازی نتایج استفاده می‌کنند. این مقاله از طریق پیاده‌سازی کدهای عملی، شهود ریاضی و مثال‌های دنیای واقعی، نقاط قوت و محدودیت‌های این روش‌ها را مقایسه می‌کند. این به ویژه پتانسیل VAE ها را در تست A/B برای مدیریت داده های از دست رفته، شبیه سازی نتایج، و تعیین کمیت عدم قطعیت، ارائه بینش برای کاربردهای آینده در بازاریابی، مراقبت های بهداشتی و سیستم های توصیه.

مقالاتی که باید حتما بخوانید

1. رونمایی از فناوری های جستجوی پیشرفته LLM توسط فلوریان جون

این مقاله به بررسی تکامل فناوری جستجو می‌پردازد، جستجوی سنتی مبتنی بر کلیدواژه را با حوزه نوظهور جستجوی پیشرفته LLM مقایسه می‌کند. جستجوی سنتی فهرستی از پیوندها را برمی‌گرداند که از کاربران می‌خواهد اطلاعات را ترکیب کنند. جستجوی تقویت‌شده با LLM از مدل‌های زبان بزرگ (LLM)، نسل افزوده‌شده بازیابی (RAG) و فناوری‌های عامل برای ارائه پاسخ‌های مستقیم و مختصر از طریق رابط‌های مکالمه استفاده می‌کند. چندین معماری از جمله Search with Lepton و MindSearch را بررسی می‌کند و جریان‌های کاری و اجزای متمایز آنها را برجسته می‌کند. ویژگی‌های کلیدی مورد بحث شامل رتبه‌بندی مجدد نتایج (با استفاده از روش‌هایی مانند OpenPerplex و منطق سفارشی) و یکپارچه‌سازی نمودار دانش برای پرس‌و‌جوهای پیچیده و چند هاپ است. نقش تجزیه PDF و تکه‌شدن متن نیز مورد توجه قرار می‌گیرد و اجرای LangChain و PyPDF2 را نشان می‌دهد. در حالی که محدودیت‌هایی مانند عملکرد در جست‌وجوهای مبتنی بر مکان و نیاز به ماژول‌های RAG پیچیده‌تر را تأیید می‌کند، نتیجه می‌گیرد که جستجوی تقویت‌شده با LLM حوزه امیدوارکننده، هرچند نوپا، با پتانسیل قابل‌توجهی برای توسعه آینده را نشان می‌دهد.

2. Gemini 2.0 Flash + Local Multimodal RAG + Context-Aware Python Project: AI/Chat آسان برای اسناد شما توسط گائو دالی (高達烈)

این مقاله به جزئیات ایجاد یک چت ربات محلی و چندوجهی مجهز به RAG با استفاده از Gemini 2.0 Flash می‌پردازد. سرعت Gemini 2.0 Flash و قابلیت‌های چندوجهی (دست زدن به تصاویر، صدا، ویدئو) را برجسته می‌کند که از نسل قبلی خود پیشی گرفته است. چت بات از یک نمودار دانش ساخته شده از فایل های PDF آپلود شده که از طریق PyMuPDF و Pillow پردازش شده اند برای ایجاد تصاویر و جاسازی ها استفاده می کند. یک رویکرد عامل دوگانه از Gemini برای خلاصه کردن و تجزیه و تحلیل محتوای PDF استفاده می‌کند و با استفاده از شباهت جاسازی، متن‌های مرتبط را شناسایی می‌کند. این سیستم که با Python و Langchain ساخته شده است، یک رابط کاربر پسند (از طریق Streamlit) برای پرس و جو و دریافت پاسخ ها فراهم می کند و مدیریت کارآمد داده های پیچیده را نشان می دهد.

3. ساختن یک نمودار دانش از داده های متنی بدون ساختار: راهنمای گام به گام توسط ANSHUL SHIVHARE

این مقاله یک راهنمای گام به گام برای ساخت یک نمودار دانش از داده های متنی بدون ساختار ارائه می دهد. از OLLAMA برای استقرار LLM محلی، افزایش عملکرد و حفظ حریم خصوصی استفاده می کند. این فرآیند با بارگیری و تکه تکه کردن اسناد متنی، سپس با استفاده از یک تابع سفارشی (graphPrompt) و Zephyr LLM برای استخراج موجودیت ها و روابط آغاز می شود. اینها در یک سازماندهی شده اند DataFrame، و لبه های مجاورت متنی برای بهبود اتصال گراف اضافه شده اند. داده‌های به‌دست‌آمده برای ایجاد یک نمودار NetworkX استفاده می‌شود، که برای تجسم مورد شناسایی قرار می‌گیرد. در نهایت، PyVis یک نمایش HTML از نمودار دانش تولید می‌کند که گره‌ها، روابط و ساختارهای جامعه را به نمایش می‌گذارد.

4. نحوه خلاصه کردن، تجزیه و تحلیل و جستجوی ویدیوها با هوش مصنوعی چندوجهی Qwen2-VL توسط ایسورو لاکشان اکانایاکا

این مقاله نحوه استفاده از مدل هوش مصنوعی چندوجهی Qwen2-VL را برای تجزیه و تحلیل ویدیوها توضیح می دهد. تنظیم یک محیط مناسب (محلی یا با استفاده) را شرح می دهد گوگل کولب)، نصب بسته های لازم و بارگذاری مدل Qwen2-VL. فرآیند اصلی با دستورات ساختاری شروع می شود که ورودی ویدیو (مشخص کردن نام فایل، حداکثر وضوح پیکسل و فریم در ثانیه – FPS – برای کنترل بار پردازش) را با سؤالات متنی یا درخواست برای خلاصه ترکیب می کند. سپس مقاله نحوه پردازش این داده های ویدئویی و آماده سازی آن برای مدل را شرح می دهد. در نهایت، نحوه استفاده از مدل Qwen2-VL برای تولید خروجی‌های متنی، از جمله خلاصه‌های ویدیویی جامع یا پاسخ به سؤالات خاص مطرح‌شده در اعلان‌ها، همراه با تکنیک‌هایی برای بهینه‌سازی عملکرد و عیب‌یابی مشکلات رایج مانند خطاهای CUDA خارج از حافظه را توضیح می‌دهد. در نهایت، برنامه‌های کاربردی دنیای واقعی را در بخش‌های مختلف بررسی می‌کند و بهترین شیوه‌ها را برای تجزیه و تحلیل ویدیویی مؤثر با Qwen2-VL ارائه می‌کند.

اگر علاقه مند به انتشار با Towards AI هستید، دستورالعمل های ما را بررسی کنید و ثبت نام کنید. اگر کار شما با خط مشی ها و استانداردهای ویرایشی ما مطابقت داشته باشد، ما آن را در شبکه خود منتشر خواهیم کرد.

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/l/55-want-to-create-a-standout-portfolio-project-with-the-latest-models