مدل جدید هوش مصنوعی Alibaba در ریاضیات اکسل می کند و از رقبا بهتر عمل می کند

علی بابا یک مدل زبان تخصصی برای حل مسائل پیچیده ریاضی ایجاد کرده است که از مدل‌های شاخص OpenAI و Anthropic بهتر عمل می‌کند.

Qwen2-ریاضی یک نسخه ریاضی خاص از علی بابا است که اخیراً منتشر شده است مدل Qwen2که توانایی حل مسائل حسابی و ریاضی را دارد.

مدل منبع باز در سه اندازه وجود دارد، از کوچک با 1.5 میلیارد پارامتر تا اندازه مدل زبان استاندارد 72 میلیارد.

هر سه مدل در ارزیابی‌های متمرکز بر ریاضی عملکرد خوبی دارند، به طوری که نسخه پرچمدار 72 میلیاردی از مدل‌های اختصاصی مانند GPT-4o و Claude 3.5 در کارهای مرتبط با ریاضی بهتر عمل می‌کند.

اعتبار: علی بابا

Qwen2-Math: “ما امیدواریم که Qwen2-Math بتواند با حل مسائل ریاضی پیشرفته که به استدلال منطقی پیچیده و چند مرحله ای نیاز دارد به جامعه علمی کمک کند.” مخزن GitHub می خواند.

محققان هوش مصنوعی علی‌بابا نوشتند که بهترین بخش از سال را صرف «تحقیق و تقویت قابلیت‌های استدلال مدل‌های بزرگ زبان» کرده‌اند تا توانایی‌شان را در رسیدگی به مسائل ریاضی بهبود بخشند.

محققان هوش مصنوعی به‌طور فزاینده‌ای بر ریاضیات به‌عنوان یک حوزه اصلی مطالعه برای تقویت استدلال مدل تمرکز می‌کنند، و معتقدند که با ارتقای توانایی مدل برای استدلال از طریق پرس‌و‌جوها به‌صورت روش‌مند، می‌تواند قابلیت‌های شناختی آن را به میزان قابل توجهی بهبود بخشد.

مرتبط:رهبران فناوری چین در کنفرانس جهانی هوش مصنوعی خواستار کاربرد عملی هوش مصنوعی هستند

به عنوان مثال، میسترالاخیرا منتشر شده است مدل ریاضی مسائل ریاضی را با استفاده از استدلال منطقی چند مرحله ای حل می کند، در حالی که سیستم های سطح پایه مانند OpenAI GPT-4o و متا لاما 3.1 405B توانایی های ریاضی بهبود یافته را به رخ بکشد.

مدل تخصصی جدید علی‌بابا از مدل‌های پیشرفته، از جمله سیستم‌های پایه در آزمون‌های معیار ریاضی، از جمله عملکرد بهتری دارد. ریاضی، ساقه MMLU و CMath و همچنین معیارهای ریاضی چینی مانند GaoKao Math QA.

علی بابا حتی نسخه‌های Instruct مدل ریاضی جدید را ایجاد کرد که در مقایسه با مدل‌های پیشرو در صنعت، به سطوح عملکردی پیشرفته‌ای دست یافت.

اعتبار: علی بابا

در حال حاضر، خط مدل‌های Qwen2-Math فقط از زبان انگلیسی پشتیبانی می‌کنند. با این حال، علی بابا گفت که نسخه های دو زبانه را برای گسترش پشتیبانی از زبان چینی توسعه خواهد داد.

علی بابا گفت که مدل‌های ریاضی خاص نیز در طول زمان بهبود می‌یابند تا توانایی آن‌ها در حل مسائل چالش‌برانگیز ریاضی را بهبود بخشند.

به مدل‌های Qwen2-Math می‌توان دسترسی پیدا کرد GitHub و صورت در آغوش گرفته.

از آن استفاده می کند همان مجوز در خط کلی مدل‌های Qwen علی‌بابا، که با نام Tongyi Qianwen شناخته می‌شود، اعمال می‌شود.

کاربران دارای مجوز غیر انحصاری و بدون حق امتیاز جهانی برای استفاده از Qwen2-Math هستند و می توانند از آن برای تقویت برنامه های تجاری با این احتیاط جدی استفاده کنند که نمی توان آن را برای محصولات یا خدمات با بیش از 100 میلیون کاربر فعال ماهانه اعمال کرد.

مرتبط:چگونه هوش مصنوعی روش اختراع انسان ها را تغییر خواهد داد

کسب‌وکارهایی که می‌خواهند از این مدل استفاده کنند اما از تعداد کاربران بالاتر هستند، باید از Alibaba Cloud مجوز درخواست کنند.

منبع: https://aibusiness.com/nlp/new-alibaba-ai-model-excels-at-math-outperforms-competitors