در طول آخر هفته ، شرکت هوش مصنوعی چینی Deepseek یک برنامه چت هوش مصنوعی از جمله یک مدل “استدلال” را که قابل مقایسه با O1 Openai است ، منتشر کرد و باعث ایجاد تحریک در بین شرکت های هوش مصنوعی آمریکایی شد زیرا Deepseek به بالای فروشگاه App Apple رسید.
Nvidia و Microsoft Stock روز دوشنبه پس از اولین بار وزوز سقوط کرد. به طور کلی ، بورس سهام منعکس کننده ناگهانی اعتماد به نفس در سازندگان هوش مصنوعی ایالات متحده بود.
برای متخصصان فناوری ، Deepseek گزینه دیگری برای نوشتن کد یا بهبود کارآیی در مورد کارهای روزانه ارائه می دهد. همراه با مدل R1 Deepseek که قادر به توضیح استدلال آن است ، این مبتنی بر یک خانواده منبع باز از مدل هایی است که می توان در GitHub به آن دسترسی پیدا کرد.
موفقیت Deepseek همچنین گفتگو در مورد آیا محدودیت های ایالات متحده در مورد دسترسی چینی ها به تراشه های AI Limited یا تشویق رقابتبشر
R1 Deepseek چیست؟
Deepseek یک شرکت Hangzhou ، مستقر در چین است که مدل های AI تولیدی و ادغام هوش مصنوعی را ارائه می دهد. اولین محصولات آن برای ایجاد امواج در بازار آمریکا عبارتند از GPT-4 مانند Deepseek-V3 و R1 ، “مدل استدلال پیشرفته”. مانند گودال، Deepseek-V3 و R1 به سرعت پاسخ های طبیعی زبان را پاسخ می دهند.
مانند OPEAI O1 (که قبلاً به عنوان توت فرنگی شناخته می شد) ، مدل استدلال قابلیت های پیش بینی خود را برای “استدلال” از طریق کار خود کاهش می دهد ، که به ارائه پاسخ های دقیق تر کمک می کند. به طور خاص ، مدل های استدلال در معیارهای ریاضی و برنامه نویسی به خوبی گلزنی کرده اند. Deepseek گفت Deepseek-V3 به ثمر رسیده است از GPT-4O در تست های MMLU و Humaneval ، دو باتری ارزیابی در مقایسه پاسخ های AI.
Deepseek گفت یکی از مدل های آن هزینه دارد 5.6 میلیون دلار برای آموزش، بخشی از پول اغلب برای پروژه های مشابه در دره سیلیکون صرف می شود.
Deepseek-V3 و R1 از طریق فروشگاه App یا مرورگر قابل دسترسی هستند. بازدید کنندگان از سایت Deepseek می توانند مدل R1 را برای پاسخ های کندتر به سؤالات پیچیده تر انتخاب کنند. هنگام انتخاب ، مدل R1 پاسخ های طولانی ایجاد می کند که به سبک مکالمه ای توضیح می دهد که چگونه به نتیجه گیری خود رسید.
از صبح روز دوشنبه ، سایت چت Deepseek هشدار داد که سرویس ممکن است مختل شود ، اگرچه Chatbot به طور عادی کار می کرد.
Deepseek همچنین API را ارائه می دهد.
مشاهده کنید: OpenAi اعلام کرد عملگر، یک عامل هوش مصنوعی که می تواند اقدامات چند مرحله ای را در یک مرورگر وب انجام دهد ، مانند انتخاب پرواز.
راه اندازی V3 و R1 Deepseek برای صنعت هوش مصنوعی چه معنایی دارد؟
“Arun Chandrasekaran” ، تحلیلگر VP برجسته Gartner ، گفت: “ما کاملاً می توانیم انتظار داشته باشیم که اکوسیستم برنامه ها بر روی R1 و همچنین چندین ارائه دهنده ابر جهانی ساخته شود که مدل های آن را به عنوان یک API قابل مصرف ارائه می دهند.” “موفقیت آینده Deepseek بر توانایی آن در نوآوری مداوم (به جای موفقیت یک طرفه) ، ایجاد یک اکوسیستم توسعه دهنده بر روی محصولات خود و غلبه بر موانع فرهنگی ، با توجه به کشور مبدا خود ، پیش بینی شده است.”
Chandrasekaran گفت: کم هزینه ، کارآیی ، نتایج معیار Deepseek و وزنه های باز آن را قابل توجه می کند.
Deepseek-V3 در 2،048 GPU NVIDIA H800 آموزش دیده بود. تولید کنندگان ایالات متحده طبق قوانین صادراتی که توسط دولت بایدن تعیین شده است ، مجاز به فروش تراشه های آموزشی AI با کارایی بالا به شرکت های مستقر در چین نیستند.
ایوان فاینست ، تحلیلگر بازار در Tigress Financial گفت: “قدرت بالقوه و توسعه کم هزینه Deepseek صدها میلیارد دلار که در ایالات متحده انجام می شود را زیر سوال می برد.” اخبار ABCبشر
Deepseek با بودن خود را متمایز می کند منبع باز، پروژه محور تحقیق ، در حالی که OpenAI به طور فزاینده ای بر تلاشهای تجاری تمرکز دارد.
“Deepseek R1 یکی از شگفت انگیزترین و چشمگیر ترین پیشرفت هایی است که من تاکنون دیده ام – و به عنوان منبع باز ، یک هدیه عمیق به جهان.” روز جمعهبشر
گارتنر گفت صنعت نیمه هادی جهانی AI در سال 2025 به 114.048 دلار خواهد رسید. گارتنر پیش بینی کرد قدرت مورد نیاز برای مراکز داده برای اجرای سرورهای AI تازه اضافه شده تا سال 2027 به 500 Terawatt-Hours می رسد.
منبع: https://www.techrepublic.com/article/deepseek-generative-ai-model-china/