چقدر Deepseek Openai را نابود کرد ، و چگونه می توانید این کار را نیز انجام دهید!


نویسنده (ها): موهیت واریکوتی

در ابتدا منتشر شده در به سمت هوش مصنوعیبشر

PTX/ASM چیست؟

این داستان فقط عضو بر ما است. برای دسترسی به همه رسانه ها ارتقا دهید.

در دنیای به سرعت در حال تحول GPU محاسبات ، عملکرد اغلب می تواند عامل ایجاد یا شکست در موفقیت یک برنامه باشد. یکی از سلاح های مخفی در چارچوب های با کارایی بالا مانند Deepseek استفاده هوشمندانه از CUDA PTX و مونتاژ درون خطی (ASM) است. کارآیی و سرعت قابل توجه Deepseek فقط از طراحی الگوریتم سطح بالا حاصل نشد. این همچنین راهی بود که Deepseek با بهره برداری از بهینه سازی های سطح پایین CUDA PTX/ASM برای فشار هر اونس عملکرد از GPU های مدرن بسیار خوب شد.

در این مقاله ، ما به زبان PTX (اجرای موضوع موازی) Cuda شیرجه می شویم و چگونگی استفاده از مونتاژ درون خطی را در هسته های CUDA می توان کشف کرد. ما خواهیم دید که PTX چیست ، چگونه در خط لوله تلفیقی CUDA قرار می گیرد و برخی از نمونه های کد عملی را بررسی می کنیم.

CUDA PTX یک زبان مونتاژ متوسط ​​است که توسط GPU های NVIDIA استفاده می شود. از PTX به عنوان “زبان مونتاژ” برای CUDA فکر کنید ، اگرچه سطح بالاتر از کد ماشین واقعی است که در آن اجرا شده است GPUبشر هنگامی که کد CUDA را با استفاده از NVCC کامپایل می کنید ، کد C/C ++ سطح بالا شما به کد PTX تبدیل می شود ، که سپس بهینه سازی می شود و بیشتر به کد باینری خاص دستگاه (SASS) برای GPU هدف ، به طور خاص تر گردآوری می شود: به طور خاص:

قابلیت حمل: PTX بسیاری از جزئیات سخت افزار را چکیده می کند ، … وبلاگ کامل را به صورت رایگان در رسانه بخوانیدبشر

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/l/how-deepseek-destroyed-openai-and-how-you-can-do-it-too