Meta از سری Llama 4 AI با معماری جدید مبتنی بر متخصص پرده برداری می کند


لاما 4 از متا.
تصویر: متا

متا در 5 آوریل از سری جدید مدل AI خود رونمایی کرد: Llama 4 ، که شامل Llama 4 Maverick و Llama 4 Scout است که به ترتیب برای مکالمه و پردازش پرونده های بزرگ ، به ترتیب ، به همراه یک مدل “معلم” منتشر نشده به نام Llama 4 Behemoth.

لاما 4 اولین سری متا برای اتخاذ “ترکیبی از معماری کارشناسان (MOE)” است. این روش فقط بخش هایی از شبکه عصبی را انتخاب می کند که به آن “متخصصان” گفته می شود ، برای رسیدگی به زیرنویس های خاص. این کار به زیرنویس ها تقسیم می شود و هر یک به مناسب ترین کارشناسان منتقل می شوند و باعث بهبود کارایی منابع می شوند.

مشخصات مربوط به Llama 4 Maverick و Scout چیست؟

Llama 4 Maverick دارای 128 متخصص و 17 میلیارد پارامتر فعال است که نشان دهنده بخشی از دانش یک مدل است که برای پردازش یک ورودی معین استفاده می شود. متا آن را به عنوان “الگوی اسب بخار محصول برای موارد دستیار عمومی و موارد استفاده از گپ” توصیف می کند ، که در تفسیر تصویر و نوشتن خلاق تخصص دارد.

جالب اینجاست که شرکت مارک زاکربرگ می بالد که ماوریک هنگام مکالمه “عملکرد بهترین کلاس به نسبت هزینه” را ارائه می دهد. هزینه از تعجب در ذهن غول های هوش مصنوعی بازی کرده است آزادی Deepseek در ژانویه، که فقط طول کشید 5.6 میلیون دلار برای آموزشبشر

ببینید: پیشنهاد 800 میلیون دلاری متا برای استارتاپ تراشه رد شد – به همین دلیل است

با این حال ، کارشناسان هوش مصنوعی متوجه شده اند که نسخه Llama 4 Maverick که در Lmarena منتشر شده است ، که در رتبه های اصلی زبان های بزرگ در کارهای مختلف قرار دارد ، “است”برای مکالمه بهینه شده استعملکرد متفاوتی دارد از نسخه عمومی در دسترس. این نشان می دهد که متا نسخه تغییر یافته ای را به Lmarena ارسال کرده است که می تواند در تابلوی رهبر خود بالاتر باشد.

Llama 4 Scout همچنین 17 میلیارد پارامتر فعال و فقط 16 متخصص دارد ، اما متا می گوید این “بهترین مدل چند مدلی در جهان در کلاس خود” است. این یک پنجره زمینه غیرمعمول بزرگ از 10 میلیون توکن است که نشان دهنده میزان اطلاعاتی است که می تواند در یک فوریت پردازش کند ، بنابراین هنگام خلاصه کردن اسناد بزرگ و در استدلال پی در پی عملکرد خوبی دارد.

متا می گوید که هر دو Scout و Maverick به دلیل تقطیر از Llama 4 Behemoth ، با 28 میلیارد پارامتر فعال و 16 متخصص “بهترین” هستند. در حالی که در حال حاضر در Lmarena در رده بسیار بالایی قرار دارد ، اما هنوز هم آموزش دیده است و منتشر نشده است. مطابق اطلاعات، اعلامیه Llama 4 به دلیل مدل های کم تحرک در معیارهای فنی و مکالمه ، حداقل دو بار به تأخیر افتاد.

چگونه می توانید به Llama 4 Maverick و Scout دسترسی پیدا کنید؟

Scout و Maverick را می توان در Llama.com و در آغوش گرفتن چهره بارگیری کرد ، یا از طریق Chatbots Meta Ai در WhatsApp ، Messenger و Instagram در 40 کشور مورد استفاده قرار گرفت. در حال حاضر از ویژگی های چندمودال فقط در ایالات متحده و انگلیسی قابل استفاده است.

برخی از شرکا قبلاً ادغام را اعلام کرده اند. توسعه دهندگان می توانند برنامه های AI را با مدل های LLAMA 4 در ریخته گری Azure Ai Microsoft و Databricks Microsoft بسازند و مستقر کنند.

لاما 4 غیر سیاسی است

متا اظهار داشت که به طور خاص برای “حذف تعصب” از مدل های Llama 4 کار کرده است. میزان امتناع از سؤالات مربوط به “مباحث سیاسی و اجتماعی بحث شده” بیش از 5 ٪ پایین تر از Llama 3.3 است و از جمله سؤالاتی که کاهش می یابد ، پاسخ های آن به عنوان “بسیار متعادل تر” توصیف می شود.

تیم دونالد ترامپ رئیس جمهور آمریكا نسبت به بی طرفی مدل های هوش مصنوعی ابراز تردید كرده است ، با هوش مصنوعی و Crypto Czar David Saws نشان می دهد كه چتپ اوپای “است”برنامه ریزی شده برای بیدار شدن“در پادکست. کارشناسان هوش مصنوعی می گویند که در نهایت تعصب ناشی از داده های آموزش است و می تواند منجر به تمایلات سیاسی از هر جهت ، نه فقط سمت چپ.

با این وجود ، شرکت زاکربرگ اقدامات اخیر را انجام داده است که نشان می دهد می خواهد با دولت ایالات متحده در کنار هم بماند. استراتژیست جمهوریخواه ، جوئل کاپلان ، به عنوان رهبری سیاست متا اندکی پس از آنکه ترامپ مقام را به عهده گرفت ، استخدام شد. او مقررات رسانه های اجتماعی را به عنوان چالش مستقیم برای گفتار آزاد.

در ژانویه ، متا فاش کرد که این شرکت در حال قطع است برنامه بررسی حقایق شخص ثالث و جابجایی تیم های اعتدال محتوای خود از کالیفرنیا به تگزاس برای “کمک به حذف این نگرانی که کارمندان مغرضانه بیش از حد سانسور می کنند.” متا نیز آن را حذف کرده است تنوع ، عدالت و گنجاندن ابتکارات پس از ترامپ از چنین برنامه هایی انتقاد کرد.

علاوه بر این ، متا گفت مدل های Llama 4 با “لاغر سیاسی قوی” در مورد موضوعات “بحث برانگیز” با یک نرخ مشابه Grok ، chatbot تولید شده توسط Xai ، یک شرکت متعلق به مشاور فعلی کاخ سفید الون مسکبشر

Llama 4 در اتحادیه اروپا قابل استفاده نیست

با توجه به LLAMA 4 سیاست استفاده قابل قبول، افراد “محل زندگی” یا شرکت هایی با “مکان اصلی تجارت” در اتحادیه اروپا نمی توانند از مدل ها استفاده یا توزیع کنند. این افراد یا شرکت ها ، در صورتی که در محصولی یا خدماتی که در منطقه به آنها دسترسی دارند ، می توانند از مدل های Llama 4 استفاده کنند.

این احتمالاً نتیجه مسائل متا با قوانین اتحادیه اروپا است ، به ویژه وقتی صحبت از هوش مصنوعی می شودبشر در ژوئن سال 2024 ، متا آموزش خود را به تأخیر انداخت مدل های بزرگ زبان در مورد محتوای عمومی به اشتراک گذاشته شده در فیس بوک و اینستاگرام پس از اتحادیه اروپا ، تنظیم کننده ها پیشنهاد کردند که ممکن است نیاز به رضایت صریح صاحبان محتوا داشته باشد. متا AI هنوز در داخل بلوک آزاد نشده است.

ببینید: متا تبلیغات شخصی کمتری را برای کاربران اتحادیه اروپا ارائه می دهد

متا یک نامه آزاد را امضا کرد که از تنظیم کننده های اروپایی خواستار شد برای پرداختن به “تصمیم گیری نظارتی ناسازگار” و نیازهای انطباق غیرقابل پیش بینی در سپتامبر گذشته. سپس ، در ماه فوریه ، متا اظهار داشت آماده برای تشدید نگرانی های خود بر آنچه شرکت به عنوان مقررات ناعادلانه اتحادیه اروپا به طور مستقیم به ترامپ می بیند.

محدودیت های دیگری در مورد استفاده Llama 4 وجود دارد ، به عنوان نهادهای تجاری با بیش از 700 میلیون کاربر فعال ماهانه باید از متا مجوز درخواست کند قبل از استفاده از مدل های آن ابتکار منبع باز گفته است که چنین محدودیتی هوش مصنوعی را از گروه “خارج می کند”منبع باز، “علیرغم اینکه متا در غیر این صورت ادعا می کند.



منبع: https://www.techrepublic.com/article/news-meta-llama-4-models/

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *