چرا پارامتر 1.8 تریلیون Grok 3 بدون تراشه های عصبی بی معنی است: یک طرح 2025


نویسنده (ها): R. Thompson (دکترا)

در ابتدا منتشر شده در به سمت هوش مصنوعیبشر

در هوش مصنوعی Wave ، هنگامی که غیرقابل توقف است ، اکنون توسط یک تنگنا منبع بسته شده است. GPU قیمت ها افزایش یافته است. زنجیره های تأمین سخت افزار شکننده هستند. مصرف برق بسیار زیاد است. پیشرفت بی امان هوش مصنوعی اکنون در اثر شکست زیرساخت ها تهدید می شود.

• زمین لرزه ژانویه TSMC جهانی فلج شده است GPU تولید

• Nvidia H100s با قیمت 30،000 – 40،000-1000 $ بالاتر از هزینه قیمت دارد

• آموزش Grok 3 خواستار 10 درجه و 100000 GPU است

• هزینه های استنباط برای مدل های برتر اکنون به 1000 دلار/پرس و جو رسیده است

• مراکز داده نسبت به ملل کوچک قدرت بیشتری را به خود جلب می کنند

این فقط یک بازگشت موقت نیست. این یک حساب اساسی با نحوه ساخت و مقیاس بندی ما است یادگیری ماشینبشر همانطور که صنعت جهانی هوش مصنوعی برای برآورده کردن تقاضا مسابقه می دهد ، اکنون با منبع سوخت ناپایدار خود: GPU مقابله می کند.

Grok 3 توسط XAI در فوریه 2025 راه اندازی شد ، یکی از جاه طلب ترین معماری های عصبی که تاکنون ساخته شده است.

• یک مدل 1.8 تریلیون پارامتر ، پیشینیان کوتوله

• آموزش در Colossus-یک ابر رایانه 100000 GPU

• در کارهای استدلال 15-20 ٪ عملکرد بیش از GPT-4O را بدست می آورد

• ابزارهای پیشرفته مانند Think Mode ، DeepSearch و ماژول های خود اصلاح را ادغام می کند

با این حال ، اطلاعات فوق بشری Grok 3 به یک الگوی سخت افزار پیری متصل می شود. هر درخواست استنتاج مقادیر فوق العاده ای از پهنای باند انرژی و حافظه را به خود اختصاص می دهد. اگر این محدودیت لازم نبود؟

“Grok 3 درخشان است – اما این سیاره را می سوزاند. تراشه های عصبی… وبلاگ کامل را به صورت رایگان در رسانه بخوانیدبشر

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/machine-learning/why-grok-3s-1-8-trillion-parameters-are-pointless-without-neuromorphic-chips-a-2025-blueprint