شماره 59: عصر هوش مصنوعی، اسمولاژنت ها و نمونه اولیه عامل “دروازه بان”


نویسنده(های): به سمت تیم تحریریه هوش مصنوعی

در ابتدا منتشر شد به سمت هوش مصنوعی.

صبح بخیر، علاقه مندان به هوش مصنوعی! همانطور که می دانید، ما اخیراً 8 ساعت خود را راه اندازی کردیم هوش مصنوعی مولد دوره پرایمر، یک زبان برنامه نویسی-آگنوستیک 1 روزه LLM بوت کمپ برای توسعه دهندگانی مانند شما طراحی شده است.

ما همچنین برای اعضای انجمن خود تخفیف ویژه ای داریم (بله، شما هستید!). از کد استفاده کنید toai_8hour برای دریافت 15 درصد تخفیف در دوره بنابراین منتظر نباشید، یاد بگیرید که از LLM ها قبل از انتشار به روز رسانی بزرگ بعدی هوش مصنوعی بهترین استفاده را ببرید. از اینجا شروع کنید!

مثل همیشه، ما آموزش های عملی، فرصت های همکاری، نمونه اولیه سرگرم کننده از جامعه، و خیلی چیزهای دیگر داریم!

PS اگر قبلاً به دوره توسعه LLM ما علاقه مند هستید، از کد استفاده کنید toai_8hour در پیشنهاد بسته ما، که شامل این دوره جدید و دوره همراه عمیق تر ما، “از مبتدی تا توسعه دهنده LLM پیشرفته”. پیشنهاد بسته را در اینجا بررسی کنید!

هفتگی هوش مصنوعی چیست

این هفته در هوش مصنوعی چیست، من در حال غواصی در دنیای APIها هستم – آنها چه هستند، چرا ممکن است به آن نیاز داشته باشید و چه گزینه های استقرار در دسترس هستند. وقتی در مورد ساخت قدرتمند صحبت می کنیم یادگیری ماشینی راه‌حل‌هایی مانند مدل‌های زبان بزرگ یا تولید تقویت‌شده بازیابی، یکی از عناصر کلیدی که اغلب در زیر رادار پرواز می‌کند، نحوه اتصال همه داده‌ها و مدل‌ها و استقرار آنها در یک محصول واقعی است. اینجاست که API ها وارد می شوند. مقاله کامل را اینجا بخوانید یا ویدیو را در یوتیوب تماشا کنید!

– لویی فرانسوا بوچارد، بنیانگذار و رئیس انجمن به سوی هوش مصنوعی

بخش جامعه هوش مصنوعی را یاد بگیرید!

پست انجمن ویژه از Discord

Malus_aiiola یک عامل صدای هوش مصنوعی “Gatekeeper” ساخته است که تماس های دریافتی را برای مدیران عامل شلوغ مدیریت می کند. در این ویدیو، او توضیح می دهد که چگونه می توانید از صدای هوش مصنوعی “Gatekeeper” بهره مند شوید که به جای شما پاسخ می دهد و اطلاعات تماس گیرنده را ضبط می کند. همچنین می‌توانید طرح اولیه و درخواست‌هایی را دریافت کنید که خودتان آن را بسازید. در تاپیک دست دراز کنید اگر می خواهید چیزی شبیه به این بسازید.

نظرسنجی هفته هوش مصنوعی!

آیا دوین امیدوار کننده است؟ آیا از نظر مفهومی خوب است، یا می بینید که آن را پذیرفته اید؟ در تاپیک به ما بگویید!

فرصت های همکاری

انجمن Learn AI Together Discord مملو از فرصت های همکاری است. اگر مشتاق هستید که در هوش مصنوعی کاربردی شیرجه بزنید، یک شریک تحصیلی می خواهید، یا حتی می خواهید شریکی برای پروژه اشتیاق خود پیدا کنید، به کانال همکاری بپیوندید! مراقب این بخش نیز باشید – ما هر هفته فرصت های جالبی را به اشتراک می گذاریم!

1. Mr_oxo به دنبال افرادی برای همکاری در پروژه های Computer Vision به عنوان شرکای پاسخگویی و دوستان حل مشکل است. اگر به بینایی کامپیوتر علاقه دارید و می خواهید مهارت های خود را در حین کار بر روی پروژه ها ارتقا دهید، در نخ وصل کنید!

2. بازی های پولکیت در حال ساخت یک مدل پیش‌بینی امتیاز توپ بعدی است و برای حل مشکل به یک شریک پروژه نیاز دارد. اگر این به نظر جالب می رسد، در تاپیک دراز کنید!

میم هفته!

میم به اشتراک گذاشته شده توسط rucha8062

بخش سرپرستی TAI

مقاله هفته

شبکه های عصبی نمودار: باز کردن قدرت روابط در پیش بینی ها توسط شنگانگ لی

این مقاله به بررسی شبکه‌های عصبی نمودار (GNN) می‌پردازد و بر توانایی آن‌ها در تجزیه و تحلیل داده‌های متصل تمرکز می‌کند. این توضیح می دهد که چگونه GNN ها گره ها و لبه ها را با استفاده از مثال هایی مانند شهرهای متصل به جاده ها تفسیر می کنند. سپس مقاله به سه نوع GNN می پردازد: GNN های کانولوشن برای پیش بینی اقتصادی، شبکه های توجه نمودار برای انتخاب ویژگیو GNN های زمانی برای پیش بینی سهام. مثال‌ها و نتایج کد، کاربرد هر GNN را نشان می‌دهند، از جمله پیش‌بینی شاخص‌های اقتصادی، شناسایی کلید مجموعه داده ویژگی ها و پیش بینی روند سهام این پتانسیل گسترده تر GNN ها را در زمینه های مختلف مانند مراقبت های بهداشتی، مدیریت ترافیک، و بازیابی اطلاعات با LLM ها برجسته می کند.

مقالاتی که باید حتما بخوانید

1. Smolagents + Web Scraper + DeepSeek V3 Python = عامل تحقیقاتی قدرتمند هوش مصنوعی توسط گائو دالی (高達烈)

این مقاله آموزشی در مورد ایجاد یک چت بات چند عاملی با استفاده از Smolagents، یک کتابخانه پایتون برای ساخت عوامل هوش مصنوعی، همراه با scraping وب و مدل زبان DeepSeek V3 ارائه می دهد. نویسنده سادگی Smolagents را برجسته می‌کند و به حداقل کد برای ایجاد عواملی که قادر به انجام وظایف پیچیده هستند، از جمله سیستم‌های Agent-Retrieval-Generation نیاز دارد. مدل DeepSeek V3 به دلیل مقرون به صرفه بودن و عملکرد آن انتخاب شد که با GPT-4 و کلود قابل مقایسه است. این مقاله با تاکید بر کارایی Smolagents و سهولت استفاده برای توسعه عوامل هوش مصنوعی پیشرفته به پایان می‌رسد.

2. ساخت پشته هوشمند اسناد در محل با Docling، Ollama، Phi-4 | ExtractThinker توسط خولیو آلمیدا

این مقاله به جزئیات ساخت یک راه‌حل هوشمند اسنادی با استفاده از ابزارهای منبع باز می‌پردازد. نگرانی‌های مربوط به حریم خصوصی داده‌های موسسات مالی را با استفاده از مدل‌های زبان محلی (LLM) مانند Phi-4 از طریق Ollama، همراه با ExtractThinker برای هماهنگ‌سازی پردازش اسناد و Docling/MarkItDown برای مدیریت بارگذاری اسناد و OCR برطرف می‌کند. خوانندگان را از طریق انتخاب LLM های مناسب (متن در مقابل دید مبتنی بر)، کتابخانه های تجزیه اسناد و راه حل های استقرار محلی راهنمایی می کند. همچنین استراتژی هایی برای مدیریت پنجره های بافت محدود در مدل های محلی، از جمله تقسیم تنبل برای اسناد بزرگ و صفحه بندی برای پاسخ های جزئی ارائه می دهد. نمونه‌های کد یکپارچه‌سازی این اجزا را برای یک خط لوله استخراج کامل سند نشان می‌دهند و راه‌حلی امن و سازگار برای پردازش داده‌های حساس ارائه می‌دهند. در نهایت، پوشش PII برای استفاده از LLM مبتنی بر ابر زمانی که استقرار محلی امکان‌پذیر نیست، مورد بحث قرار می‌گیرد.

3. Building Multimodal RAG برنامه شماره 8: قرار دادن آن در کنار هم! ساخت اپلیکیشن RAG چندوجهی توسط یوسف حسنی

این مقاله یک راهنمای جامع برای ساختن یک برنامه کاربردی چندوجهی بازیابی-نسل افزوده (RAG) ارائه می‌کند که مجموعه هشت قسمتی را به اوج می‌رساند. این ماژول‌ها را برای پیش‌پردازش داده‌های چندوجهی، بازیابی اطلاعات با استفاده از یک فروشگاه برداری LanceDB، و تولید پاسخ‌ها با مدل‌های زبان چشم‌انداز بزرگ (LVLM) از طریق یک کلاینت PredictionGuard یکپارچه می‌کند. جزئیات تنظیم محیط، پردازش داده ها (از جمله جاسازی متن-تصویر)، ساخت ماژول بازیابی، پیاده سازی استنتاج LVLM، و درخواست های پردازش. در نهایت، ترکیب این ماژول ها را در یک سیستم RAG عملکردی چندوجهی با استفاده از LangChain نشان می دهد، و امکان جستجوهای پیچیده را در برابر انواع داده های مختلف مانند متن و ویدئو فراهم می کند.

4. عصر هوش مصنوعی: یک آغازگر توسط کاوش بی

این مقاله مقدمه‌ای درباره عصر هوش مصنوعی Agentic ارائه می‌کند و سیر تکامل هوش مصنوعی از ابزارهای اتوماسیون به عوامل مستقل را بررسی می‌کند. عوامل هوش مصنوعی را تعریف می کند و آنها را بر اساس نوع و معماری دسته بندی می کند توپولوژیو ویژگی ها و مراحل توسعه آنها را در یک زمینه سازمانی مشخص می کند. این جریان‌های کاری مختلف، از جمله زنجیره‌سازی سریع، مسیریابی، موازی‌سازی، ارکستراتور-کارگران و مدل‌های ارزیاب-بهینه‌ساز را شرح می‌دهد. همچنین چهار الگوی اصلی طراحی عامل را مورد بحث قرار می دهد: بازتاب، استفاده از ابزار، برنامه ریزی و همکاری چند عامل. دستورالعمل‌های اجرایی عملی، ریسک‌های فنی و استراتژی‌های کاهش نیز مورد توجه قرار گرفته‌اند. این مقاله با تأکید بر پتانسیل تحول آفرین هوش مصنوعی عامل در حالی که چالش های اخلاقی و اجتماعی را که مستلزم بررسی دقیق برای استقرار مسئولانه است، تأیید می کند.

اگر علاقه مند به انتشار با Towards AI هستید، دستورالعمل های ما را بررسی کنید و ثبت نام کنید. اگر کار شما با خط مشی ها و استانداردهای ویرایشی ما مطابقت داشته باشد، ما آن را در شبکه خود منتشر خواهیم کرد.

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/artificial-intelligence/59-the-agentic-ai-era-smolagents-and-a-gatekeeper-agent-prototype