علی بابا یک مدل زبان تخصصی برای حل مسائل پیچیده ریاضی ایجاد کرده است که از مدلهای شاخص OpenAI و Anthropic بهتر عمل میکند.
Qwen2-ریاضی یک نسخه ریاضی خاص از علی بابا است که اخیراً منتشر شده است مدل Qwen2که توانایی حل مسائل حسابی و ریاضی را دارد.
مدل منبع باز در سه اندازه وجود دارد، از کوچک با 1.5 میلیارد پارامتر تا اندازه مدل زبان استاندارد 72 میلیارد.
هر سه مدل در ارزیابیهای متمرکز بر ریاضی عملکرد خوبی دارند، به طوری که نسخه پرچمدار 72 میلیاردی از مدلهای اختصاصی مانند GPT-4o و Claude 3.5 در کارهای مرتبط با ریاضی بهتر عمل میکند.

اعتبار: علی بابا
Qwen2-Math: “ما امیدواریم که Qwen2-Math بتواند با حل مسائل ریاضی پیشرفته که به استدلال منطقی پیچیده و چند مرحله ای نیاز دارد به جامعه علمی کمک کند.” مخزن GitHub می خواند.
محققان هوش مصنوعی علیبابا نوشتند که بهترین بخش از سال را صرف «تحقیق و تقویت قابلیتهای استدلال مدلهای بزرگ زبان» کردهاند تا تواناییشان را در رسیدگی به مسائل ریاضی بهبود بخشند.
محققان هوش مصنوعی بهطور فزایندهای بر ریاضیات بهعنوان یک حوزه اصلی مطالعه برای تقویت استدلال مدل تمرکز میکنند، و معتقدند که با ارتقای توانایی مدل برای استدلال از طریق پرسوجوها بهصورت روشمند، میتواند قابلیتهای شناختی آن را به میزان قابل توجهی بهبود بخشد.
به عنوان مثال، میسترالاخیرا منتشر شده است مدل ریاضی مسائل ریاضی را با استفاده از استدلال منطقی چند مرحله ای حل می کند، در حالی که سیستم های سطح پایه مانند OpenAI GPT-4o و متا لاما 3.1 405B توانایی های ریاضی بهبود یافته را به رخ بکشد.
مدل تخصصی جدید علیبابا از مدلهای پیشرفته، از جمله سیستمهای پایه در آزمونهای معیار ریاضی، از جمله عملکرد بهتری دارد. ریاضی، ساقه MMLU و CMath و همچنین معیارهای ریاضی چینی مانند GaoKao Math QA.
علی بابا حتی نسخههای Instruct مدل ریاضی جدید را ایجاد کرد که در مقایسه با مدلهای پیشرو در صنعت، به سطوح عملکردی پیشرفتهای دست یافت.

اعتبار: علی بابا
در حال حاضر، خط مدلهای Qwen2-Math فقط از زبان انگلیسی پشتیبانی میکنند. با این حال، علی بابا گفت که نسخه های دو زبانه را برای گسترش پشتیبانی از زبان چینی توسعه خواهد داد.
علی بابا گفت که مدلهای ریاضی خاص نیز در طول زمان بهبود مییابند تا توانایی آنها در حل مسائل چالشبرانگیز ریاضی را بهبود بخشند.
به مدلهای Qwen2-Math میتوان دسترسی پیدا کرد GitHub و صورت در آغوش گرفته.
از آن استفاده می کند همان مجوز در خط کلی مدلهای Qwen علیبابا، که با نام Tongyi Qianwen شناخته میشود، اعمال میشود.
کاربران دارای مجوز غیر انحصاری و بدون حق امتیاز جهانی برای استفاده از Qwen2-Math هستند و می توانند از آن برای تقویت برنامه های تجاری با این احتیاط جدی استفاده کنند که نمی توان آن را برای محصولات یا خدمات با بیش از 100 میلیون کاربر فعال ماهانه اعمال کرد.
کسبوکارهایی که میخواهند از این مدل استفاده کنند اما از تعداد کاربران بالاتر هستند، باید از Alibaba Cloud مجوز درخواست کنند.
منبع: https://aibusiness.com/nlp/new-alibaba-ai-model-excels-at-math-outperforms-competitors