دستیابی به موفقیت بعدی AI مدل های بزرگتر نیست ، این محصولات بهتر هستند – مجله زمان AI


اعتبار: رسانه Tencent

به عنوان هوش مصنوعی Boom به سال سوم خود حرکت می کند ، سرعت نوآوری بی امان است ، اما مرکز ثقل در حال تغییر است. هنگامی که بر اندازه مدل ، بودجه های آموزش و نمرات معیار تسلط داشته باشید ، مکالمه به طور فزاینده ای روی چیزی بسیار کاربردی متمرکز می شود: آیا این مدل ها می توانند در حال حاضر برای افراد واقعی کار مفیدی انجام دهند؟

تعداد فزاینده ای از شرکت ها ، به ویژه شرکت های خارج از مسابقه اولیه Silicon Valley AI ، شرط می بندند که موج اصلی بعدی AI در مورد بزرگترین مدل نیست ، بلکه در مورد ساخت مفیدترین است.

از پارامترها گرفته تا مناسب بازار محصول

در سالهای 2023 و 2024 ، آزمایشگاه ها و استارتاپ های هوش مصنوعی برای آموزش مدل های همیشه بزرگتر ، از GPT-4 تا Gemini 1.5 تا Claude Opus به رقابت پرداختند. اما بسیاری از این دستاوردها ، هرچند چشمگیر ، اغلب برای کاربران نهایی غیرقابل تصور بودند. امروز ، تیم های محصول در سراسر صنعت به طور فزاینده ای می پرسند: چقدر سریع پاسخ می دهد؟ آیا گردش کار من را درک می کند؟ آیا می تواند روی سخت افزار ارزان تر اجرا شود؟ آیا والدین من یا همکاران کارخانه من می توانند از آن استفاده کنند؟

این تغییر نظری نیست. در سال 2025 ، 10 مدل برتر در chatbot arena، یک تابلوی عملکردی شلوغ که میزبان Busging Face است ، اکنون شامل چندین LLMS بهینه شده برای پاسخگویی ، چند مدلی بودن و استقرار آزاد است. یک مثال قابل توجه: Tencent’s Hunyuan Turbo S، که بی سر و صدا در رده بندی بر قدرت استدلال و راندمان دنیای واقعی خود افزایش یافت. Turbo S با استفاده از یک معماری ترکیبی Mamba-Moe ساخته شده ، تأخیر کم و تفکر ساختاری را بر روی تعداد پارامترهای خالص در اولویت قرار می دهد.

اما مهمتر از این است که چگونه Tencent مدل ساخته شده است چگونه از آن استفاده می شودبشر

AI که فقط نسخه ی نمایشی نیست – ارائه می دهد

در حرکتی که برخی از ناظران صنعت را غافلگیر کرد ، Tencent خانواده مدلهای Hunyuan خود را در مجموعه ای گسترده از محصولات مصرف کننده و سازمانی ادغام کرده است: برنامه های پیام رسانی (WeChat ، QQ) ، ابزارهای اسناد ، مرورگرها و حتی دستیار صدابشر در شهرهای روستایی ، دستیار هوش مصنوعی فراخوانده شد یونابا در حال کمک به کشاورزان و خرده فروشان کوچک پیش نویس قراردادها ، تولید نسخه بازاریابی و آماده سازی برای امتحانات صدور مجوز ، همه از طریق موبایل است.

هدف فقط ارسال یک هوش مصنوعی نیست بلکه احساس هوش مصنوعی می کند نامرئی ، تعبیه شده و مفید، آنچه یک محصول سرب توصیف می کند “مانند یک همکار واقعاً تیز که هرگز خسته نمی شود.”

Tencent تنها نیست. در سراسر صنعت ، شرکت ها این را می آموزند LLMS نه به این دلیل که کاربران AI می خواهند ، بلکه به این دلیل که می خواهند نتیجه بگیرند.بشر این که آیا این کد نوشتن ، اشکال زدایی قراردادها یا تولید دارایی های بازی سه بعدی است ، مدل ها به طور فزاینده ای نه در انزوا ارزیابی می شوند ، بلکه به عنوان ابزارهای زیرساختی که مردم قبلاً به آنها اعتماد دارند ، ارزیابی می شوند.

در آغوش بازی طولانی: تکرار بیش از اعتیاد به مواد مخدره

منتقدین زمانی برخی از شرکت ها – Tencent را متهم کردند – از “لحظه گم شدن” در هوش مصنوعی. اما اگر سال 2023 در مورد راه اندازی بود ، به نظر می رسد 2025 در مورد فرود است. Tencent سرمایه گذاری هوش مصنوعی خود را افزایش داده و بیش از 76.8 میلیارد پوند (10.6 میلیارد دلار) در هزینه های سرمایه برای زیرساخت های هوش مصنوعی در سال 2024 تخصیص داده است. در داخل ، بخش هوش مصنوعی آن دوباره سازماندهی شد مدل زبانبا گروه های چند حالته ، داده و سیستم عامل، امکان هماهنگی چابک تر بین تحقیقات مدل و استقرار محصول.

به موازات این شرکت در منبع باز دو برابر شد. 3D Hunyuan، مدلی برای تبدیل تصاویر و متن به دارایی های سه بعدی ، آشکارا منتشر شد و قبلاً گذشت 1.6 میلیون بارگیریاکنون توسط توسعه دهندگان در طراحی بازی ، روباتیک و AR استفاده می شود. مهندسان Tencent همچنین در زمینه های باز کردن چارچوب هایی مانند Deepseek’s Deepep ، حتی بهبود عملکرد شبکه خود را در سخت افزار غیر تخصصی نیز در زمینه عملکردهای بازکشی کرده اند.

یکی از مهندسان آشنا با تلاش های هوش مصنوعی Tencent ، گفت: “ما کمتر روی نشان دادن معیارها تمرکز کرده ایم و بیشتر در یافتن جایی که هوش مصنوعی تغییر می کند – و سپس بهبود آن قطعه را متمرکز می کنیم.”

قدرت زیرساخت ها و توزیع

یک مزیت رقابتی زیر بحث؟ توزیعبشر شرکت هایی که دارای پایگاه های بزرگ کاربر موجود هستند – و زیرساخت های ارسال به روزرسانی های مکرر – می توانند پس از آماده شدن مدل های خود سریعتر حرکت کنند.

به عنوان مثال ، دستیار AI Tencent’s AI ، فشار آورد 16 به روزرسانی در 30 روز پس از ادغام مدل های Deepseek R1 و Turbo S. کاربران فعال روزانه پرش کردند 20 برابر در طی یک پنجره دو ماهه. چنین حلقه های بازخورد به تیم ها اجازه می دهد تا به سرعت تکرار و مرتب شوند و از مدل هایی در زمینه های متنوع به عنوان آمادگی آزمون ورودی کالج ، ناوبری شهری یا پیشرفت های جستجوی مرورگر استفاده کنند.

این الگوی “توزیع اول AI” در حال تبدیل شدن به یک طرح برای سایر شرکت ها است که هدف آن هدایت فرزندخواندگی فراتر از پذیرندگان اولیه فناوری است. نتیجه یک برنامه قاتل مفرد نیست ، بلکه یک اکوسیستم از عوامل کوچک و هدفمند، هر یک به یک نیاز خاص تنظیم شده است.

از فناوری تا TouchPoint

مرز بعدی برای هوش مصنوعی فقط حل مشکلات بزرگتر نیست بلکه حل می شود بیشتر انسان ها: نحوه خدمت به کارگران کارخانه ، دانشجویان روستایی ، صاحبان مشاغل کوچک یا کارمندان بیمارستان خط مقدم. و در آن زمینه ، تأثیرگذارترین مدل ها ممکن است مدل هایی نباشند که عناوین را ایجاد می کنند ، بلکه مدل هایی هستند که بی سر و صدا زندگی را آسان تر می کندبشر

هوش مصنوعی ممکن است بزرگترین تغییر فناوری این دهه باشد ، اما برای کاربران ، اغلب به یک سؤال کاهش می یابد: آیا این برای من در حال حاضر مفید است؟

کلاس جدیدی از LLMS ، کوچکتر ، سریعتر و پایه تر ، شروع به پاسخ به بله می کند.



منبع: https://www.aitimejournal.com/ais-next-breakthrough-isnt-bigger-models-its-better-products/

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *