Qwen 2.5 Coder 32B: آیا این بهترین مدل وزن باز بهتر از GPT-4o و غزل کلود 3.5 است؟

نویسنده(های): برهومی مصبه

در ابتدا منتشر شد به سمت هوش مصنوعی.

در 11 نوامبر، علی بابا پیشرفته ترین مدل کدنویسی خود را تا به امروز معرفی کرد: Qwen 2.5-Coder-32B-Instruct. اما این همه چیز نیست، در واقع بخشی از یک خانواده کامل از مدل های کدنویسی است! علاوه بر مدل 32B، نسخه هایی با پارامترهای 0.5B، 1.5B، 3B، 7B و 14B وجود دارد. قبل از نوشتن این مقاله، بازخورد بسیاری از یوتیوب‌برها، نویسندگان و کارشناسان فنی را بررسی کردم و اتفاق نظر بسیار مثبت بود. امروز، ما بررسی خواهیم کرد که آیا واقعاً مطابق با تبلیغات تبلیغاتی است یا خیر.

من مدتی است که از ChatGPT، Gemini و Claude استفاده می کنم و می توانم با اطمینان بگویم که کلود در کدنویسی و درک وظایف پیچیده بهترین است. صادقانه بگویم، جمینی در یک لیگ متفاوت است. واقعیت جالب: من یک بار برنده شدم یادگیری ماشینی رقابت دو سال پیش با استفاده از Bard (که اکنون به عنوان جمینی تغییر نام داده شده است) زیرا همه از ChatGPT استفاده می کردند. عملکرد بارد در آن زمان به من برتری رقابتی داد. امروز، من معتقدم Gemini ممکن است بهترین مدل بینایی موجود باشد، اما در کل، من طرفدار زیادی نیستم.

به ارزیابی کنید عملکرد مدل در کدنویسی، باید سه جنبه کلیدی زیر را پوشش دهیم: تولید کد، تعمیر کد، و استدلال کد. علاوه بر این، ما باید در نظر بگیریم که مدل از چند زبان برنامه نویسی پشتیبانی می کند و همسویی آن با ترجیحات انسانی.

نمای کلی

قبل از آزمایش مدل علی بابا، بیایید نگاهی به نتایج عملکردی که آنها اعلام کرده اند بیندازیم.

بر اساس معیارهای داخلی آنها، حتی از GPT-4 نیز بهتر است و به کلود 3.5 بسیار نزدیک است. با این حال، من شخصاً وزن زیادی برای معیارهای داخلی به تنهایی قائل نیستم، اما نتایج به نظر کسانی که آن را امتحان کرده اند بسیار جالب به نظر می رسد.

شما می توانید جزئیات بیشتر در مورد عملکرد را در اینجا بیابید:

Qwen2.5-Coder-32B-Instruct – Qwen2

اکنون زمان آن است، 11 نوامبر 10:24! بهترین زمان برای بهترین مدل کدگذار ما تا کنون! Qwen2.5-Coder-32B-Instruct!

qwen2.org

من در حال تست مدل به صورت محلی با استفاده از اولاما:

qwen2.5-coder:32b

آخرین سری از مدل‌های Qwen خاص کد، با پیشرفت‌های قابل توجه در تولید کد، استدلال کد و…

olama.com

همچنین می توانید این مدل را در صفحه نمایشی Hugging Face امتحان کنید:

نسخه ی نمایشی کدگذار Qwen2.5 – فضای صورت در آغوش گرفته توسط Qwen

برنامه های شگفت انگیز ML ساخته شده توسط انجمن را کشف کنید

huggingface.co

تولید کد

بسیاری از افراد قبلاً نحوه عملکرد آن در طراحی وب و طراحی را پوشش داده اند:

منبع: https://towardsai.net/p/l/qwen-2-5-coder-32b-is-this-best-open-weight-model-better-than-gpt-4o-and-claude-3-5-sonnet

Qwen 2.5 Coder 32B: آیا این بهترین مدل وزن باز بهتر از GPT-4o و غزل کلود 3.5 است؟

نویسنده(های): برهومی مصبه

نمای کلی

Qwen2.5-Coder-32B-Instruct – Qwen2

اکنون زمان آن است، 11 نوامبر 10:24! بهترین زمان برای بهترین مدل کدگذار ما تا کنون! Qwen2.5-Coder-32B-Instruct!

qwen2.5-coder:32b

آخرین سری از مدل‌های Qwen خاص کد، با پیشرفت‌های قابل توجه در تولید کد، استدلال کد و…

نسخه ی نمایشی کدگذار Qwen2.5 – فضای صورت در آغوش گرفته توسط Qwen

برنامه های شگفت انگیز ML ساخته شده توسط انجمن را کشف کنید

تولید کد

اعلان

پاسخ دهید

نتایج

اعلان

پاسخ دهید

نتایج

تعمیر کد

اعلان

پاسخ دهید

نتایج و بازخورد

LLM های تخصصی: دوره ای جدید در هوش مصنوعی