به روز رسانی مدل OpenAI ChatGPT استدلال پیشرفته ای را ارائه می دهد

OpenAI به روز رسانی ChatGPT به نام OpenAI o1 را منتشر کرده است که اولین مورد از سری جدید مدل‌های هوش مصنوعی است که برای تکمیل کارهای پیچیده‌تر و حل مشکلات سخت‌تر در علوم، کدنویسی و ریاضی طراحی شده است.

در طول توسعه به عنوان Strawberry شناخته می شد، یک نسخه پیش نمایش از o1 برای کاربران موجود ChatGPT در دسترس قرار گرفته است. دو نسخه وجود دارد، o1-preview برای کاربران عمومی، با محدودیت پرس و جو 50 در هفته، و o1-mini با هدف توسعه دهندگان، ارائه 50 پرس و جو در روز.

به گفته این شرکت، محققان مراقبت های بهداشتی می توانند از آن برای حاشیه نویسی داده های توالی سلولی، فیزیکدانان برای تولید فرمول های ریاضی پیچیده مورد نیاز برای اپتیک کوانتومی و توسعه دهندگان در همه زمینه ها برای ساخت و اجرای گردش های کاری چند مرحله ای استفاده کنند.

فرآیند خودآموزی

در حالی که OpenAI از اصطلاحاتی مانند «تفکر» و «استدلال» برای مدل‌های جدید خود استفاده می‌کند، نشان‌دهنده گامی رو به جلو در هوش مصنوعی مولد است اما به هدف نهایی صنعت برای ایجاد هوش عمومی مصنوعی (AGI) نزدیک نیست.

ChatGPT در یک پست وبلاگ اعلام شد که o1 و مدل‌های آتی سری قبل از پاسخ دادن، زمان بیشتری را صرف پردازش می‌کنند و از یک فرآیند خودآموزی برای یادگیری استراتژی‌های جدید و تشخیص اشتباهات استفاده می‌کنند.

این شرکت ادعا کرد: «در آزمایش‌های ما، به‌روزرسانی مدل بعدی مشابه دانشجویان دکترا در مورد وظایف محک چالش‌برانگیز در فیزیک، شیمی و زیست‌شناسی عمل می‌کند». ما همچنین دریافتیم که در ریاضیات و کدنویسی برتر است. در یک امتحان مقدماتی برای المپیاد بین‌المللی ریاضیات (IMO)، GPT-4o تنها 13 درصد از مسائل را به درستی حل کرد، در حالی که مدل استدلالی 83 درصد را به دست آورد.

مرتبط:آغازگر استراتژی هوش مصنوعی مولد برای مدیران

با این حال، این نسخه اولیه o1 در مقایسه با ChatGPT محدودیت هایی دارد، به عنوان مثال، قادر به مرور وب یا آپلود فایل ها و تصاویر مانند موتور فعلی ربات چت GPT-4o نیست.

همانطور که مدیر عامل شرکت سم آلتمن در پستی در X (توئیتر سابق) گفت: “o1 هنوز هم معیوب است، هنوز محدود است و هنوز در اولین استفاده تاثیرگذارتر از زمانی است که زمان بیشتری را با آن سپری می کنید.”

آموزش ایمنی

OpenAI مدل جدید را “خطرناک ترین” آن توصیف کرده است، اما این به طور گسترده ای به عنوان بازاریابی خالص رد شده است. در واقع، این شرکت چندین تدابیر ایمنی و حفاظ‌ها را برای جلوگیری از دور زدن آن‌ها در نظر گرفته است، فرآیندی که به نام جیلبریک شناخته می‌شود. به گفته این شرکت، GPT-4o امتیاز 22 (در مقیاس 0-100) را در تست داخلی جیلبریک خود کسب کرد در حالی که مدل o1-preview آن امتیاز 84 را کسب کرد.

این شرکت اخیراً با اعطای دسترسی زودهنگام به نسخه تحقیقاتی این مدل برای ایجاد فرآیندی برای تحقیق، ارزیابی و آزمایش مدل‌های آینده قبل از انتشار، شروع به اجرای توافق‌نامه‌هایی با مؤسسه‌های ایمنی هوش مصنوعی ایالات متحده و بریتانیا کرده است.

مرتبط:گوگل، مایکروسافت، OpenAI Square Up در هوش مصنوعی مولد

منبع: https://aibusiness.com/nlp/openai-chatgpt-model-update-offers-advanced-reasoning