OpenAI به روز رسانی ChatGPT به نام OpenAI o1 را منتشر کرده است که اولین مورد از سری جدید مدلهای هوش مصنوعی است که برای تکمیل کارهای پیچیدهتر و حل مشکلات سختتر در علوم، کدنویسی و ریاضی طراحی شده است.
در طول توسعه به عنوان Strawberry شناخته می شد، یک نسخه پیش نمایش از o1 برای کاربران موجود ChatGPT در دسترس قرار گرفته است. دو نسخه وجود دارد، o1-preview برای کاربران عمومی، با محدودیت پرس و جو 50 در هفته، و o1-mini با هدف توسعه دهندگان، ارائه 50 پرس و جو در روز.
به گفته این شرکت، محققان مراقبت های بهداشتی می توانند از آن برای حاشیه نویسی داده های توالی سلولی، فیزیکدانان برای تولید فرمول های ریاضی پیچیده مورد نیاز برای اپتیک کوانتومی و توسعه دهندگان در همه زمینه ها برای ساخت و اجرای گردش های کاری چند مرحله ای استفاده کنند.
فرآیند خودآموزی
در حالی که OpenAI از اصطلاحاتی مانند «تفکر» و «استدلال» برای مدلهای جدید خود استفاده میکند، نشاندهنده گامی رو به جلو در هوش مصنوعی مولد است اما به هدف نهایی صنعت برای ایجاد هوش عمومی مصنوعی (AGI) نزدیک نیست.
ChatGPT در یک پست وبلاگ اعلام شد که o1 و مدلهای آتی سری قبل از پاسخ دادن، زمان بیشتری را صرف پردازش میکنند و از یک فرآیند خودآموزی برای یادگیری استراتژیهای جدید و تشخیص اشتباهات استفاده میکنند.
این شرکت ادعا کرد: «در آزمایشهای ما، بهروزرسانی مدل بعدی مشابه دانشجویان دکترا در مورد وظایف محک چالشبرانگیز در فیزیک، شیمی و زیستشناسی عمل میکند». ما همچنین دریافتیم که در ریاضیات و کدنویسی برتر است. در یک امتحان مقدماتی برای المپیاد بینالمللی ریاضیات (IMO)، GPT-4o تنها 13 درصد از مسائل را به درستی حل کرد، در حالی که مدل استدلالی 83 درصد را به دست آورد.
با این حال، این نسخه اولیه o1 در مقایسه با ChatGPT محدودیت هایی دارد، به عنوان مثال، قادر به مرور وب یا آپلود فایل ها و تصاویر مانند موتور فعلی ربات چت GPT-4o نیست.
همانطور که مدیر عامل شرکت سم آلتمن در پستی در X (توئیتر سابق) گفت: “o1 هنوز هم معیوب است، هنوز محدود است و هنوز در اولین استفاده تاثیرگذارتر از زمانی است که زمان بیشتری را با آن سپری می کنید.”
آموزش ایمنی
OpenAI مدل جدید را “خطرناک ترین” آن توصیف کرده است، اما این به طور گسترده ای به عنوان بازاریابی خالص رد شده است. در واقع، این شرکت چندین تدابیر ایمنی و حفاظها را برای جلوگیری از دور زدن آنها در نظر گرفته است، فرآیندی که به نام جیلبریک شناخته میشود. به گفته این شرکت، GPT-4o امتیاز 22 (در مقیاس 0-100) را در تست داخلی جیلبریک خود کسب کرد در حالی که مدل o1-preview آن امتیاز 84 را کسب کرد.
این شرکت اخیراً با اعطای دسترسی زودهنگام به نسخه تحقیقاتی این مدل برای ایجاد فرآیندی برای تحقیق، ارزیابی و آزمایش مدلهای آینده قبل از انتشار، شروع به اجرای توافقنامههایی با مؤسسههای ایمنی هوش مصنوعی ایالات متحده و بریتانیا کرده است.
منبع: https://aibusiness.com/nlp/openai-chatgpt-model-update-offers-advanced-reasoning