نویسنده(های): به سمت تیم تحریریه هوش مصنوعی
در ابتدا منتشر شد به سمت هوش مصنوعی.
اتفاقی که این هفته در هوش مصنوعی توسط لویی افتاد
“چارچوب انتشار هوش مصنوعی” دولت بایدن رونمایی شده است که قوانین گسترده ای را برای مدیریت نحوه صادرات و استفاده از فناوری های پیشرفته هوش مصنوعی در سطح جهانی تعیین می کند. چارچوب یک سیستم سه لایه برای صادرات تراشه های هوش مصنوعی و وزن مدل ایجاد می کند، با هدف ایجاد تعادل بین رهبری فناوری ایالات متحده و همکاری بین المللی. این قوانین باعث واکنش فوری انویدیا و سایر شرکت های فناوری شد و در عین حال از حمایت محتاطانه برخی از کارشناسان امنیت ملی برخوردار شد. این چارچوب در روزهای پایانی دولت بایدن معرفی شد که منجر به گمانه زنی هایی در مورد طول عمر آن و پتانسیل دولت ترامپ برای تغییر یا لغو آن شد. دوره نظر 120 روزه نیز ممکن است تغییرات قابل توجهی را امکان پذیر کند.
در هسته خود، این چارچوب سطوح مختلف دسترسی به فناوری هوش مصنوعی ایالات متحده را ایجاد می کند. سطح بالای 18 متحد نزدیک اساساً دسترسی نامحدود را حفظ می کند. سطح میانی که بیشتر کشورها را پوشش می دهد، با محدودیت هایی در واردات توان محاسباتی مواجه است، مگر اینکه الزامات امنیتی خاصی را برآورده کنند. این گروه عملاً حدود 50000 تراشه هوش مصنوعی پیشرفته را تا سال 2027 محدود کرده است، بدون استثنا و توافق. سطح پایین کشورهای محدود شده تا حد زیادی از دسترسی به تراشه هایی که معیارهای خاصی را برآورده می کنند مسدود می کند.
این قوانین همچنین صادرات وزن های مدل هوش مصنوعی بالاتر از آستانه های خاص را کنترل می کند (در ابتدا یک آستانه دلخواه از عملیات محاسباتی 1026 یا بیشتر در طول آموزش). با این حال، مدل های وزن باز کنترل نشده باقی می مانند. این چارچوب به استانداردهای امنیتی برای میزبانی وزن سیستمهای هوش مصنوعی قدرتمند در سطح بینالمللی نیاز دارد.
انویدیا به شدت به این فریمورک پاسخ داد، آن را “بی سابقه و نادرست” خواند و در عین حال استدلال کرد که “نوآوری و رشد اقتصادی در سراسر جهان را از مسیر خارج می کند.” این شرکت پیشنهاد میکند این قوانین کشورها را به سمت جایگزینهای چینی سوق میدهد تا اینکه به اهداف امنیتی مورد نظر خود دست یابند. منتقدان دیگر درباره پیامدهای دیپلماتیک هشدار می دهند و خاطرنشان می کنند که بسیاری از متحدان خود را در ردیف دو می بینند. با این حال، دولت متقابل میکند که چین ظرفیتی برای «پر کردن» صادرات محدود تراشه در کوتاه مدت ندارد. آنها استدلال می کنند که این اهرمی برای تشویق پذیرش استانداردهای امنیتی ایالات متحده در ازای دسترسی محاسباتی ایجاد می کند.
چرا باید اهمیت بدی؟
این چارچوب می تواند به طور قابل توجهی توسعه جهانی هوش مصنوعی را تغییر دهد، اما اینکه آیا این کار را به طور موثر انجام خواهد داد باید دید. سوال گستردهتر این است که آیا این چارچوب به اهداف اعلامشده خود دست خواهد یافت یا نوآوری را مختل میکند، در برابر رهبری فعلی فناوری ایالات متحده نتیجه معکوس میدهد و پراکندگی در چشمانداز جهانی هوش مصنوعی را تشدید میکند. آیا کشورهای درجه دو با استانداردهای ایالات متحده هماهنگ خواهند شد یا به دنبال جایگزین هایی در فناوری های چینی یا منبع باز خواهند بود؟ آیا بوروکراسی ایالات متحده می تواند چنین سیستم پیچیده ای را بدون ایجاد تاخیر و ناکارآمدی اجرا کند؟ آیا این قوانین واقعاً امنیت ملی را تقویت میکنند یا صرفاً حرکات نمادینی هستند که نمیتوانند خطرات واقعی هوش مصنوعی را برطرف کنند؟ در کوتاه مدت، این می تواند گلوگاه جدیدی برای GPU ها ایجاد کند LLM دسترسی توکن حتی در ایالات متحده، زیرا ظرفیت مرکز داده جهانی برنامه ریزی شده برای کشورهای سطح 2 به تأخیر می افتد؟
با توجه به باور ما به قابلیت، کاربرد و ادامه سرعت رشد این مدلها، پاسخ به این سؤالات نه تنها مسیر رهبری هوش مصنوعی ایالات متحده، بلکه پویایی جهانی فناوری و قدرت را در سالهای آینده شکل خواهد داد.
– لویی پیترز – به سوی یکی از بنیانگذاران و مدیرعامل هوش مصنوعی
داغ ترین اخبار
1. Mistral AI Codestral 25.01 را معرفی کرد، نسخه به روز شده مدل Codestral
کدسترال 25.01 دارای معماری کارآمدتر و توکنایزر بهبود یافته نسبت به نسخه اصلی است که حدود 2 برابر سریعتر کد تولید و تکمیل می کند. این مدل اکنون در رده وزنی خود و SOTA برای موارد استفاده از FIM در سراسر صفحه، در معیارهای کدنویسی پیشرو است.
2. مایکروسافت مدل قدرتمند Phi-4 را روی صورت در آغوش گرفته کاملاً منبع باز می سازد
مایکروسافت مدل Phi-4 خود را به عنوان یک پروژه کاملا متن باز با وزنه های قابل دانلود در Hugging Face منتشر کرده است. اگرچه Phi-4 در ماه گذشته توسط مایکروسافت معرفی شد، اما استفاده از آن در ابتدا به پلتفرم توسعه جدید Azure AI Foundry مایکروسافت محدود شد. در حال حاضر، Phi-4 خارج از آن سرویس اختصاصی در دسترس است و با مجوز مجاز MIT ارائه می شود که امکان استفاده از آن را برای برنامه های تجاری فراهم می کند. این مدل تاکنون 60000 بار در Hugging Face دریافت کرده است.
3. مدیر عامل انویدیا می گوید تراشه های هوش مصنوعی او سریعتر از قانون مور پیشرفت می کنند
جنسن هوانگ، مدیرعامل انویدیا، ادعا میکند که تراشههای هوش مصنوعی این شرکت از قانون مور پیشی میگیرند و به بهبود عملکرد 30 برابر سریعتر از مدلهای قبلی دست مییابند. این تکامل می تواند هزینه های استنباط هوش مصنوعی را کاهش دهد زیرا تراشه های جدیدتر توانایی محاسباتی را افزایش می دهند.
4. مارک زاکربرگ به تیم لاما متا اجازه داد تا در مورد آثار دارای حق نسخهبرداری آموزش ببینند و ادعاها را ثبت کنند.
شاکیان در یک شکایت حق چاپ ادعا می کنند که مارک زاکربرگ، مدیر عامل متا، استفاده از محتوای غیرقانونی از LibGen را برای آموزش مدل های Llama علیرغم نگرانی های داخلی تایید کرده است. آنها متا را متهم می کنند که داده های کپی رایت را برای پنهان کردن نقض و تورنت غیرقانونی LibGen با هدف دور زدن روش های قانونی متهم می کند.
5. NVIDIA خانواده های مدل Nemotron را برای پیشرفت هوش مصنوعی Agentic اعلام کرد
همانطور که به طور خلاصه در هفته گذشته ذکر شد، در CES 2025، جنسن هوانگ، مدیرعامل انویدیا، مدلهای جدید Nemotron از جمله Llama Nemotron را معرفی کرد. مدل های زبان بزرگ (LLMs) و مدلهای زبان بینایی Cosmos Nemotron (VLMs)، برای بهبود هوش مصنوعی عامل و افزایش بهرهوری سازمانی. مدلهای Llama Nemotron که بر اساس مدلهای پایه Llama ساخته شدهاند، به توسعهدهندگان اجازه میدهند تا عوامل هوش مصنوعی را برای برنامههایی مانند پشتیبانی مشتری، تشخیص تقلب و بهینهسازی زنجیره تامین ایجاد کنند.
6. Cohere شمال را معرفی می کند: فضای کاری ایمن هوش مصنوعی برای انجام کارهای بیشتر
Cohere برنامه دسترسی زودهنگام را برای North راهاندازی کرد، یک پلت فرم فضای کاری هوش مصنوعی همهجانبه برای بهبود کیفیت و سرعت کارشان. نورث به کارمندان در تیمها و صنایع کمک میکند تا وظایف روتین را انجام دهند و زمان خود را بر جایی متمرکز کنند که بتوانند بیشترین ارزش را برای شرکت خود بیافزایند. North LLM ها، جستجو و عوامل را در یک پلت فرم بصری ترکیب می کند که هوش مصنوعی را در کار روزانه شما ادغام می کند.
پنج مطالعه/فیلم 5 دقیقه ای برای حفظ یادگیری شما
1. ساخت مدل های اقدام بزرگ: بینش های مایکروسافت
چارچوب مایکروسافت برای ساخت LAM نشان دهنده یک پیشرفت قابل توجه در هوش مصنوعی است که امکان تغییر از درک زبان غیرفعال به تعامل فعال در دنیای واقعی را فراهم می کند. این مقاله رویکرد جامع چارچوب را بررسی میکند که شامل جمعآوری دادهها، آموزش مدل، یکپارچهسازی عامل و ارزیابی دقیق است و پایهای قوی برای ساخت LAMها فراهم میکند.
2. تجسم و درک حافظه GPU در PyTorch
مقاله توضیح می دهد پردازنده گرافیکی استفاده از حافظه در PyTorch، ارائه ابزارهایی برای تجسم حافظه و بهینه سازی استفاده. تخمین حافظه را برای پارامترهای مدل، حالت های بهینه ساز، فعال سازی ها و شیب ها، با در نظر گرفتن عواملی مانند اندازه دسته.
3. بهترین روش ها برای ساخت و استقرار API های مقیاس پذیر در سال 2025
ساخت، استقرار و مدیریت یک API یک گام مهم برای مقیاسبندی محصولات، اتصال سیستمها و اطمینان از برقراری ارتباط یکپارچه همه چیز است. این مقاله به بررسی دنیای APIها میپردازد – اینکه آنها چه هستند، چرا ممکن است به آن نیاز داشته باشید و چه گزینههای استقرار در دسترس هستند.
4. GPT-4o Python Charting Insanity: Prompting for Instant Data Visuals
GPT-4o با نمایش تجسم در پنجره چت، فرآیند ایجاد کد تجسم داده های پایتون را بسیار ساده می کند. این پست یک آموزش گام به گام در زمینه تولید تصاویر بدون کد به صورت دستی از مجموعه داده ها.
5. 6 نکته مخفی من برای به دست آوردن شغل ML در سال 2025
راه های مختلفی برای گرفتن یک وجود دارد شغل در ML. این پست وبلاگ شش نکته در مورد فرود یک را به اشتراک می گذارد. این بر سوالاتی تاکید می کند که باید از خود بپرسید، مانند اینکه چگونه مهارت خود را نشان دهید و چگونه نشان دهید که واقعاً می توانید به یک پروژه ارزش بیافزایید.
مخازن و ابزار
- تابلوی امتیازات FACTS معیاری است که دقت واقعی LLM ها را اندازه گیری می کند و به توهمات می پردازد.
- پرطرفدار مدل های باز LLM فهرستی از بیش از 5000 مدل منبع باز است.
مقالات برتر هفته
1. rStar-Math: LLM های کوچک می توانند با تفکر عمیق خود تکامل یافته بر استدلال ریاضی مسلط شوند.
rStar-Math نشان می دهد که مدل های زبان کوچک می توانند در استدلال ریاضی بدون تقطیر از OpenAI o1 پیشی بگیرند. پیاده سازی تفکر عمیق از طریق مونت کارلو جستجوی درخت و تکامل خود، rStar-Math مدلها را برای حل مسائل پیشرفته بهبود میبخشد و دقت Qwen2.5-Math-7B را تا 90 درصد افزایش میدهد. 53.3٪ از مسائل المپیاد ریاضی ایالات متحده آمریکا را حل می کند و در 20٪ دانش آموزان برتر قرار می گیرد.
2. REINFORCE++: رویکردی ساده و کارآمد برای تراز کردن مدلهای زبان بزرگ
این مقاله REINFORCE++ را ارائه میکند، یک نوع بهبودیافته از الگوریتم REINFORCE که تکنیکهای بهینهسازی کلیدی را از PPO ترکیب میکند و در عین حال نیاز به یک شبکه انتقادی را حذف میکند. این رویکرد سادگی، افزایش ثبات آموزشی و کاهش هزینه های محاسباتی را ارائه می دهد.
3. VideoRAG: Retrieval-Augmented Generation از طریق Video Corpus
VideoRAG به صورت پویا ویدئوهای مرتبط را بر اساس ارتباط پرس و جو بازیابی می کند و از اطلاعات بصری و متنی در تولید خروجی استفاده می کند. از مدلهای بزرگ زبان ویدیویی برای پردازش محتوای ویدیویی برای بازیابی استفاده میکند و این ویدیوها را با درخواستها ادغام میکند.
4. در تشخیص ناهنجاری سری های زمانی غوطه ور شوید: مروری بر یک دهه
در سال های اخیر پیشرفت هایی در یادگیری ماشینی منجر به روشهای مختلف تشخیص ناهنجاری سریهای زمانی شدهاند که برای زمینههایی مانند امنیت سایبری و مراقبتهای بهداشتی حیاتی هستند. این بررسی این روش ها را تحت یک طبقه بندی فرآیند محور دسته بندی می کند. این یک متاآنالیز برای شناسایی روندها در تحقیقات انجام می دهد و تغییر از معیارهای آماری به الگوریتم های یادگیری ماشین برای تشخیص ناهنجاری ها را برجسته می کند.
5. TabPFN: یک ترانسفورماتور که مشکلات طبقه بندی جدولی کوچک را در یک ثانیه حل می کند
این مقاله TabPFN، یک ترانسفورماتور آموزش دیده را ارائه می کند که می تواند طبقه بندی نظارت شده را برای مجموعه داده های جدولی کوچک در کمتر از یک ثانیه انجام دهد. نیازی به تنظیم هایپرپارامتر ندارد و با روش های طبقه بندی پیشرفته قابل رقابت است.
لینک های سریع
1. LlamaIndex گردش کار سند عامل را معرفی می کند، معماری ای که پردازش اسناد، بازیابی، خروجی های ساختاریافته و هماهنگ سازی عاملی را برای خودکارسازی کار دانش سرتاسر ترکیب می کند.
2. جدید لیست مشاغل OpenAI برنامه های روباتیک این شرکت را نشان می دهد. کیتلین کالینوفسکی در پستی در X گفت که تیم روباتیک OpenAI روی رباتهای «عمومی»، «تطبیقی» و «همه کاره» تمرکز خواهد کرد که میتوانند با هوش انسانمانند در تنظیمات «دینامیک» و «دنیای واقعی» کار کنند. .
3. محققان منبع باز Sky-T1، یک مدل هوش مصنوعی “استدلال” که می توان آن را با کمتر از 450 دلار آموزش داد. به نظر می رسد Sky-T1 اولین مدل استدلال منبع باز واقعی باشد زیرا می توان آن را از ابتدا تکرار کرد. این تیم مجموعه داده ای را که برای آموزش آن استفاده کردند و کد آموزشی لازم را منتشر کردند.
چه کسی در هوش مصنوعی استخدام می کند
کارآموزی تابستانی 2025، دانشمند تحقیقات فناوری — دکترا @Spotify (لندن، انگلستان)
AI / معمار مدل زبان بزرگ @Accenture (چندین مکان در ایالات متحده)
توسعه دهنده پایتون @InvestorFlow (Remote)
تحلیلگر تجسم داده @RYZ Labs (از راه دور در آرژانتین و اروگوئه)
متخصص مهندسی کیفیت مبتنی بر هوش مصنوعی (PCD-PWD) @CloudWalk (Remote)
مهندس نرم افزار III — Backend @Deputy (ملبورن، FL، ایالات متحده آمریکا)
Junior Backend Engineer — Search @BlaBlaCar (پاریس یا ریموت از فرانسه)
علاقه مند به اشتراک گذاری یک فرصت شغلی در اینجا هستید؟ تماس بگیرید [email protected].
فکر می کنید دوستی هم از این کار لذت می برد؟ خبرنامه را به اشتراک بگذارید و به آنها اجازه دهید به گفتگو بپیوندند.
منتشر شده از طریق به سمت هوش مصنوعی