#61: آیا LLM ها وارد سن مأمورین می شوند؟



نویسنده (ها): به سمت تیم تحریریه AI که در ابتدا به سمت هوش مصنوعی منتشر شده است. صبح بخیر ، علاقه مندان به او! به نظر می رسد که مأمورین استدلال در دو هفته گذشته هوش مصنوعی را به دست آورده اند. در حالی که زود است ، این طبقه از عوامل با استدلال احتمالاً در پذیرش LLM و تأثیر اقتصادی به سطح بعدی پیشرفت می کند. بنابراین ، بیایید این هفته را با درک اول با درک اینکه دقیقاً یک عامل چیست ، شروع کنیم. ما همچنین منابع زیادی داریم که همه چیز را از طراحی ، معماری و کاربردهای LLAMA ، مقایسه بین Openai GPT ، Deepseek و Qwen2.5 گرفته تا فوق العاده هوش مصنوعی و مدل های یادگیری عمیق “جعبه سیاه” پوشش می دهیم. از خواندن لذت ببرید! هفتگی AI ، اکثریت قریب به اتفاق آنچه که ما از آنها می نامیم ، صرفاً یک تماس API به یک مدل زبان هستند. اینها نمی توانند به طور مستقل عمل کنند ، تصمیم بگیرند یا هر کاری انجام دهند. این به سادگی به کاربران شما پاسخ می دهد. با این حال ، ما آنها را مأمور می نامیم. اما این چیزی نیست که ما نیاز داریم. ما به عوامل واقعی احتیاج داریم ، اما یک عامل واقعی چیست؟ به زبان ساده ، یک عامل واقعی چیزی است که به طور مستقل عمل می کند. این دقیقاً همان چیزی است که من در این هفته شیرجه می زنم. مقاله کامل را در اینجا بخوانید یا فیلم را در YouTube تماشا کنید. -لوئیز-فرانسوا بوچارد ، به سمت بنیانگذار AI و رئیس جامعه یادگیری AI با هم بخش جامعه! نظرسنجی AI هفته! نتایج نظرسنجی تعجب آور است. بیشتر شما معتقدید که گزینه های دیگر بسیار مشابه هستند. آیا این O1 ، Deepseek یا افراد دیگری هستند؟ در موضوع به ما بگویید! فرصت های همکاری The Learn Ai Ai Together Community Community Discord با فرصت های همکاری در حال سیل است. اگر از شیرجه رفتن به AI Applied ، می خواهید یک شریک مطالعه بخواهید ، یا حتی می خواهید یک شریک برای پروژه Passion خود پیدا کنید ، به کانال همکاری بپیوندید! به این بخش نیز توجه داشته باشید – ما هر هفته فرصت های جالب را به اشتراک می گذاریم! 1. مونگونگ در حال ایجاد چارچوبی است که از هوش مصنوعی مبتنی بر Hypergraph ، تعبیه Tensor و استدلال تطبیقی ​​برای حل مشکلات پیچیده در حوزه ها استفاده می کند. اگر مایل به پیوستن به پروژه هستید ، در موضوع وصل شوید! 2. Thebaburuidas در حال ساخت یک دستیار مد AI است که از تشخیص تصویر استفاده می کند و به دنبال یک بنیانگذار است. اگر این جالب به نظر می رسد ، به موضوع دسترسی پیدا کنید! Meme of Week! Meme به اشتراک گذاشته شده توسط Hitoriarchie Tai بخش بخش مقاله در هفته باز کردن پتانسیل Meta Llama: یک شیرجه عمیق در طراحی ، معماری و برنامه های کاربردی آن توسط Shenggang Li ، این مقاله به بررسی Llama Meta ، یک مدل زبان بزرگ طراحی شده برای کارآیی و دسترسی است. این جزئیات معماری ترانسفورماتور اساسی ، از جمله مکانیسم های خودآگاهی ، تعبیه های موقعیتی و شبکه های تغذیه ای را نشان می دهد و توضیح می دهد که چگونه این مؤلفه ها در قابلیت های لاما نقش دارند. این بهینه سازی های Llama ، مانند تعبیه موقعیت دوار (طناب) را برای بهبود کنترل دنباله طولانی و اتصال وزن برای کاهش تعداد پارامتر برجسته می کند. همچنین در مورد فرایند آموزش Llama ، از جمله هدف و تکنیک های مدل سازی زبان علی که برای آموزش کارآمد در مجموعه داده های بزرگ استفاده می شود ، بحث می کند. سرانجام ، این راهنمایی های عملی را در مورد اجرای لاما با استفاده از اولاما ، بغل کردن ترانسفورماتورهای صورت یا سیستم عامل های ابری مانند AWS یا لاجورد ارائه می دهد و مزایا و محدودیت های هر رویکرد را تشریح می کند. مقالات ما باید بخوانید. و Falkordb Deepseek-R1 ، یک مدل زبان بزرگ منبع باز که به تازگی منتشر شده است ، به دلیل مقرون به صرفه بودن و عملکرد قابل مقایسه با مدل O1 OpenAi برجسته شده است. این جزئیات در مورد ساخت چت بابات ، با تأکید بر استفاده از ویژگی های Langchain: PDFPlumberLoader برای پردازش PDF ، معنایی برای تقسیم متن ، FAISS برای جستجوی کارآمد و ایجاد زنجیرهای بازیابی برای پاسخ های آگاهی از متن. chatbot با استفاده از اسناد ، اطلاعات را استخراج می کند ، اطلاعات را بر اساس پرس و جوهای کاربر و سابقه مکالمه ایجاد می کند. همچنین این روش آموزش منحصر به فرد Deepseek-R1 را با استفاده از یادگیری تقویت شده بدون تنظیم دقیق تحت پوشش قرار می دهد. 2. فوق العاده هوش مصنوعی (ASI): مرزهای تحقیق برای دستیابی به AGI به ASI و چالش های بشریت توسط Mohit Sewak ، دکتری این مقاله به بررسی مسیرهای بالقوه برای هوش مصنوعی (ASI) می پردازد و یادگیری عمیق مقیاس را بررسی می کند ، هوش مصنوعی نورو-سمبولیک ، معماری شناختی ، تقلید کامل مغز و الگوریتم های تکاملی. همچنین این چالش های مهم ، از جمله درک آگاهی ، حل مشکل سخت هوش ، اطمینان از کنترل و تراز ارزش ، مدیریت رفتارهای نوظهور و کاهش خطرات وجودی را شرح می دهد. این نتیجه گیری با در نظر گرفتن مزایای احتمالی اتوپیایی ASI – حل مشکلات جهانی ، تسریع در کشف علمی و تقویت بهره وری – ضمن تأیید خطرات دیستوپی بیکاری گسترده ، غلظت قدرت و تهدیدات وجودی. در نهایت ، بر لزوم توسعه مسئولانه ، همکاری جهانی و ملاحظات اخلاقی برای حرکت در این فناوری تحول تأکید می کند. پیش بینی رویداد محور: گسترش مدل های فضایی حالت مامبا برای پیش بینی مشروط توسط Shenggang LI این مقاله یک رویکرد جدید برای پیش بینی سری زمانی شرطی ، به ویژه برای قیمت سهام ارائه می دهد. این مدل با ترکیب دینامیک رویداد محور با الهام از فرآیندهای تصمیم گیری مارکوف ، مدل فضایی حالت Mamba را گسترش می دهد. این به مدل اجازه می دهد تا حرکات قیمت آینده (هم مداوم و چه باینری) را بر اساس داده های گذشته و رویدادهای خاص آینده ، مانند قیمت عبور از یک آستانه کلیدی پیش بینی کند. این روش با استفاده از داده های شبیه سازی شده با نتایج امیدوارکننده ، اندازه گیری شده توسط معیارهایی مانند MSE ، MAPE ، AUC ، نمره F1 و آمار KS نشان داده شده است. نویسنده همچنین پیشنهاد می کند که کارهای آینده شامل داده های دنیای واقعی و کشف مدل سازی پیچیده تر رویداد خواهد بود. مدل حاصل ، بینش ارزشمندی را برای معامله گران و سرمایه گذاران در مدیریت ریسک ، توسعه استراتژی و نظارت بر بازار ارائه می دهد ، با برنامه های بالقوه در بهینه سازی نمونه کارها و تجارت با فرکانس بالا. 4. چگونه می توان مدل های یادگیری عمیق جعبه سیاه را در دید رایانه و NLP توسط Chien Vu توضیح داد ، این مقاله در مورد چالش های تفسیر مدل های یادگیری عمیق “جعبه سیاه” در دید رایانه و پردازش زبان طبیعی (NLP) بحث می کند. این اهمیت توضیح و تفسیر را برای ذینفعان مختلف از جمله دانشمندان داده ، رهبران تجارت و تنظیم کننده ها برجسته می کند. سپس Omnixai ، یک کتابخانه پایتون را ارائه می دهد که روش های مختلف توضیح را ارائه می دهد. با استفاده از مثالها ، این نشان می دهد که چگونه تکنیک های Omnixai-مانند Shap ، Lime ، Gradients یکپارچه ، Grad-CAM ، Score-CAM و توضیحات ضد خلاف-می تواند برای تجزیه و تحلیل پیش بینی های مدل برای طبقه بندی تصویر و تجزیه و تحلیل احساسات استفاده شود ، نشان می دهد که کدام ویژگی ها به طور قابل توجهی نقش دارد برای مدل سازی تصمیمات و ارائه بینش در مورد تعصب مدل بالقوه. این مقاله همچنین بر نقش ابزارهای توضیح پذیری مانند Omnixai در ساختن AI قابل اعتماد تر و پاسخگوتر تأکید دارد […]



منبع: https://towardsai.net/p/artificial-intelligence/61-are-llms-entering-the-age-of-agents