نویسنده (ها): بینش و نوآوری های آدی
در ابتدا منتشر شده در به سمت هوش مصنوعیبشر
صنعت هوش مصنوعی بین دو فلسفه قدرتمند-دموکراتیک سازی منبع باز و نوآوری اختصاصی تقسیم می شود. OLMO 2 (مدل زبان باز 2) ، که توسط Allenai تهیه شده است ، نشان دهنده اوج توسعه شفاف AI با دسترسی کامل عمومی به معماری آن است و داده های آموزشبشر در مقابل ، Claude 3.5 Sonnet ، مدل پرچمدار Anthropic ، قابلیت های برنامه نویسی درجه تجاری و استدلال چندمادی را در پشت درهای بسته اولویت بندی می کند.
این مقاله به معماری های فنی آنها ، موارد استفاده و گردش کار عملی ، با نمونه های کد و مجموعه داده منابع این که آیا شما در حال ایجاد یک چت بابات استارتاپی هستید یا راه حل های سازمانی را مقیاس می دهید ، این راهنما به شما کمک می کند تا یک انتخاب آگاهانه انجام دهید.
در این مقاله ، شما:
درک کنید که چگونه گزینه های طراحی (به عنوان مثال ، rmsnorm ، تعبیه کننده های چرخشی) بر ثبات آموزش و عملکرد در Olmo 2 و Claude 3.5 غزل تأثیر می گذارد. در مورد هزینه های API مبتنی بر تومون (Claude 3.5) در مقابل سربار خودآزمایی (OLMO 2) هر دو مدل در سناریوهای کدگذاری عملی ، کانترنولوس از طریق تستانهای Concrections.cropare از طریق Concrection Performents. تفاوت های اساسی معماری بین OLMO 2 و Claude 3.5 Sonnet. تجارت مقرون به صرفه را برای نیازهای مختلف پروژه ارزیابی کنید.
OLMO 2 یک الگوی زبان خودجوش کاملاً منبع باز است که بر روی یک مجموعه داده عظیم شامل 5 تریلیون نشانه آموزش دیده است. با افشای کامل وزن ، داده های آموزش و کد منبع که محققان و توسعه دهندگان را به … وبلاگ کامل را به صورت رایگان در رسانه بخوانیدبشر
منتشر شده از طریق به سمت هوش مصنوعی
منبع: https://towardsai.net/p/l/olmo-2-vs-claude-3-5-sonnet-a-head-to-head-ai-showdown