نویسنده(های): به سمت تیم تحریریه هوش مصنوعی
در ابتدا منتشر شد به سمت هوش مصنوعی.
صبح بخیر، علاقه مندان به هوش مصنوعی! این هفته، مجموعهای از آموزشهای عملی را داریم که برای تقویت پروژههای نمونه کار شما عالی هستند. اگر قبلاً آن را بررسی نکردهاید، ما همچنین یک دوره آموزشی بسیار عمیق را راهاندازی کردهایم که به شما کمک میکند تا یک ۶ رقمی بخرید. شغل به عنوان یک LLM توسعه دهنده در اینجا می توانید به پیش نمایش رایگان نگاهی بیندازید.
به علاوه، شماره این هفته مملو از فرصت های همکاری هیجان انگیز، منابع ارزشمند و بحث است. از خواندن لذت ببرید 🙂
هفتگی هوش مصنوعی چیست
https://www.youtube.com/watch?v=CWTSImmqcvQ
تنظیم دقیق رقیبی برای RAG نیست اما می تواند آن را تکمیل کند. با آموزش مدل بر روی داده های خاص، بازیابی اسناد مرتبط تری را نیز پیدا می کند و مولد می تواند پاسخ های دقیق تری بدهد زیرا هر دو موضوع را بهتر درک می کنند. این فرآیند خطاها را کاهش می دهد و پاسخ ها را واضح تر و دقیق تر می کند. تکنیک های مختلفی برای تنظیم دقیق تر مدل شما وجود دارد. این هفته، بیایید برخی از این تکنیک ها را بررسی کنیم و بفهمیم که چگونه می توانند خط لوله RAG شما را بهبود بخشند. مقاله کامل را اینجا بخوانید یا ویدیو را در یوتیوب تماشا کنید!
– لویی فرانسوا بوچارد، بنیانگذار و رئیس انجمن به سوی هوش مصنوعی
بخش جامعه هوش مصنوعی را یاد بگیرید!
نظرسنجی هفته هوش مصنوعی!
من با آن مخالف نیستم، به سوی هوش مصنوعی همه چیز در مورد دسترسی به هوش مصنوعی است. اما، تمام قوانین یادگیری که در مورد هوش مصنوعی اعمال می شود، یادگیری ماشینی، و NLP همیشه اعمال نمی شود LLMsبه خصوص اگر در حال ساخت چیزی هستید یا به دنبال شغلی با درآمد بالا هستید. دانستن آنچه که با LLM امکان پذیر نیست به همان اندازه مهم است که دانستن آنچه ممکن است. و با سرعت توسعه LLM، شما زمان لازم برای اختراع مجدد چرخ را ندارید، اینجاست که من شخصاً در مورد دورههای پولی نظارت شده و آزمایش شده پاسخ میدهم. دوست دارم نظرات شما را در این مورد بشنوم و بفهمم که چه موانعی برای پرداخت هزینه یک دوره وجود دارد. همه را در تاپیک به اشتراک بگذارید، و بیایید صحبت کنیم!
فرصت های همکاری
انجمن Learn AI Together Discord مملو از فرصت های همکاری است. اگر مشتاق هستید که در هوش مصنوعی کاربردی شیرجه بزنید، یک شریک تحصیلی می خواهید، یا حتی می خواهید شریکی برای پروژه اشتیاق خود پیدا کنید، به کانال همکاری بپیوندید! مراقب این بخش نیز باشید – ما هر هفته فرصت های جالبی را به اشتراک می گذاریم!
1. اورفاوالم در حال توسعه یک برنامه تلفن همراه مبتنی بر هوش مصنوعی برای کمک به افراد دارای معلولیت است و به دنبال یک یا دو توسعه دهنده با تجربه در توسعه برنامه های تلفن همراه و NLP یا بینایی کامپیوتری اگر این برای شما مرتبط و جالب به نظر می رسد، در تاپیک دراز کنید!
2. لوفوفز__ به دنبال 1 تا 2 مهندس برای کار بر روی یک پروژه چند عامله است که در حال جذب است. اگر می خواهید در این مورد بیشتر بدانید، در نخ وصل کنید!
3. شوبهامگور. به دنبال همکاری با کسی است MLپروژه مبتنی بر – یادگیری عمیق، پیتورچ. اگر این به نظر هیجان انگیز است، در تاپیک با آنها تماس بگیرید!
میم هفته!
میم به اشتراک گذاشته شده توسط bigbuxchungus
بخش سرپرستی TAI
مقاله هفته
رمزگشایی متغیرهای پنهان: مقایسه رویکردهای بیزی، EM و VAE توسط شنگانگ لی
این مقاله یک تجزیه و تحلیل جامع از سه روش آماری برای کشف الگوهای پنهان در داده ها ارائه می دهد: حداکثر سازی انتظارات (EM)، تخمین بیزی، و رمزگذارهای خودکار متغیر (VAEs). این نشان می دهد که چگونه هر روش داده های ناقص را مدیریت می کند و الگوهای اساسی را با استفاده از سناریوهای تست A/B در کمپین های بازاریابی نشان می دهد. این مطالعه نشان میدهد که چگونه EM به طور مکرر اطلاعات از دست رفته را اصلاح میکند، تخمین بیزی دانش قبلی را با دادههای جدید برای نتایج مطمئن ترکیب میکند، و VAEها از شبکههای عصبی برای تولید احتمالات جدید و شبیهسازی نتایج استفاده میکنند. این مقاله از طریق پیادهسازی کدهای عملی، شهود ریاضی و مثالهای دنیای واقعی، نقاط قوت و محدودیتهای این روشها را مقایسه میکند. این به ویژه پتانسیل VAE ها را در تست A/B برای مدیریت داده های از دست رفته، شبیه سازی نتایج، و تعیین کمیت عدم قطعیت، ارائه بینش برای کاربردهای آینده در بازاریابی، مراقبت های بهداشتی و سیستم های توصیه.
مقالاتی که باید حتما بخوانید
1. رونمایی از فناوری های جستجوی پیشرفته LLM توسط فلوریان جون
این مقاله به بررسی تکامل فناوری جستجو میپردازد، جستجوی سنتی مبتنی بر کلیدواژه را با حوزه نوظهور جستجوی پیشرفته LLM مقایسه میکند. جستجوی سنتی فهرستی از پیوندها را برمیگرداند که از کاربران میخواهد اطلاعات را ترکیب کنند. جستجوی تقویتشده با LLM از مدلهای زبان بزرگ (LLM)، نسل افزودهشده بازیابی (RAG) و فناوریهای عامل برای ارائه پاسخهای مستقیم و مختصر از طریق رابطهای مکالمه استفاده میکند. چندین معماری از جمله Search with Lepton و MindSearch را بررسی میکند و جریانهای کاری و اجزای متمایز آنها را برجسته میکند. ویژگیهای کلیدی مورد بحث شامل رتبهبندی مجدد نتایج (با استفاده از روشهایی مانند OpenPerplex و منطق سفارشی) و یکپارچهسازی نمودار دانش برای پرسوجوهای پیچیده و چند هاپ است. نقش تجزیه PDF و تکهشدن متن نیز مورد توجه قرار میگیرد و اجرای LangChain و PyPDF2 را نشان میدهد. در حالی که محدودیتهایی مانند عملکرد در جستوجوهای مبتنی بر مکان و نیاز به ماژولهای RAG پیچیدهتر را تأیید میکند، نتیجه میگیرد که جستجوی تقویتشده با LLM حوزه امیدوارکننده، هرچند نوپا، با پتانسیل قابلتوجهی برای توسعه آینده را نشان میدهد.
2. Gemini 2.0 Flash + Local Multimodal RAG + Context-Aware Python Project: AI/Chat آسان برای اسناد شما توسط گائو دالی (高達烈)
این مقاله به جزئیات ایجاد یک چت ربات محلی و چندوجهی مجهز به RAG با استفاده از Gemini 2.0 Flash میپردازد. سرعت Gemini 2.0 Flash و قابلیتهای چندوجهی (دست زدن به تصاویر، صدا، ویدئو) را برجسته میکند که از نسل قبلی خود پیشی گرفته است. چت بات از یک نمودار دانش ساخته شده از فایل های PDF آپلود شده که از طریق PyMuPDF و Pillow پردازش شده اند برای ایجاد تصاویر و جاسازی ها استفاده می کند. یک رویکرد عامل دوگانه از Gemini برای خلاصه کردن و تجزیه و تحلیل محتوای PDF استفاده میکند و با استفاده از شباهت جاسازی، متنهای مرتبط را شناسایی میکند. این سیستم که با Python و Langchain ساخته شده است، یک رابط کاربر پسند (از طریق Streamlit) برای پرس و جو و دریافت پاسخ ها فراهم می کند و مدیریت کارآمد داده های پیچیده را نشان می دهد.
3. ساختن یک نمودار دانش از داده های متنی بدون ساختار: راهنمای گام به گام توسط ANSHUL SHIVHARE
این مقاله یک راهنمای گام به گام برای ساخت یک نمودار دانش از داده های متنی بدون ساختار ارائه می دهد. از OLLAMA برای استقرار LLM محلی، افزایش عملکرد و حفظ حریم خصوصی استفاده می کند. این فرآیند با بارگیری و تکه تکه کردن اسناد متنی، سپس با استفاده از یک تابع سفارشی (graphPrompt) و Zephyr LLM برای استخراج موجودیت ها و روابط آغاز می شود. اینها در یک سازماندهی شده اند DataFrame، و لبه های مجاورت متنی برای بهبود اتصال گراف اضافه شده اند. دادههای بهدستآمده برای ایجاد یک نمودار NetworkX استفاده میشود، که برای تجسم مورد شناسایی قرار میگیرد. در نهایت، PyVis یک نمایش HTML از نمودار دانش تولید میکند که گرهها، روابط و ساختارهای جامعه را به نمایش میگذارد.
4. نحوه خلاصه کردن، تجزیه و تحلیل و جستجوی ویدیوها با هوش مصنوعی چندوجهی Qwen2-VL توسط ایسورو لاکشان اکانایاکا
این مقاله نحوه استفاده از مدل هوش مصنوعی چندوجهی Qwen2-VL را برای تجزیه و تحلیل ویدیوها توضیح می دهد. تنظیم یک محیط مناسب (محلی یا با استفاده) را شرح می دهد گوگل کولب)، نصب بسته های لازم و بارگذاری مدل Qwen2-VL. فرآیند اصلی با دستورات ساختاری شروع می شود که ورودی ویدیو (مشخص کردن نام فایل، حداکثر وضوح پیکسل و فریم در ثانیه – FPS – برای کنترل بار پردازش) را با سؤالات متنی یا درخواست برای خلاصه ترکیب می کند. سپس مقاله نحوه پردازش این داده های ویدئویی و آماده سازی آن برای مدل را شرح می دهد. در نهایت، نحوه استفاده از مدل Qwen2-VL برای تولید خروجیهای متنی، از جمله خلاصههای ویدیویی جامع یا پاسخ به سؤالات خاص مطرحشده در اعلانها، همراه با تکنیکهایی برای بهینهسازی عملکرد و عیبیابی مشکلات رایج مانند خطاهای CUDA خارج از حافظه را توضیح میدهد. در نهایت، برنامههای کاربردی دنیای واقعی را در بخشهای مختلف بررسی میکند و بهترین شیوهها را برای تجزیه و تحلیل ویدیویی مؤثر با Qwen2-VL ارائه میکند.
اگر علاقه مند به انتشار با Towards AI هستید، دستورالعمل های ما را بررسی کنید و ثبت نام کنید. اگر کار شما با خط مشی ها و استانداردهای ویرایشی ما مطابقت داشته باشد، ما آن را در شبکه خود منتشر خواهیم کرد.
منتشر شده از طریق به سمت هوش مصنوعی