هنگامی که کلود به گپ پایان می دهد: حفاظت جدید این انسان شناسی برای شما چه معنی دارد


غذای اصلی

  • Claude Opus 4 وت Opus 4.1 هم اکنون می تواند مکالمه را در موارد نادر و شدید پس از امتناع مکرر و تغییر مسیر ناموفق به پایان برساند ، یا هنگامی که کاربر صریحاً بخواهد چت را پایان دهد.
  • این حراست در مورد سناریوهای بحران صدق نمی کند (به عنوان مثال ، خودآزاری یا آسیب قریب الوقوع به دیگران). در این موارد ، کلود همچنان با پاسخ های پشتیبانی گرا ادامه می دهد.
  • وقتی چت به پایان رسید ، نخ قفل می شود. با ویرایش و آزمایش مجدد می توانید بلافاصله یک چت یا شعبه جدید را از پیام های قبلی شروع کنید.
  • Anthropic با تأکید بر عدم اطمینان و رویکرد محتاطانه و کم هزینه ، تغییر را به تحقیق در مورد رفاه بالقوه AI/Model متصل می کند.
  • یادداشت های اولیه پوشش این مرحله “پایان گفتگو” در بین دستیاران اصلی غیر معمول است و در موارد لبه شدید هدف قرار می گیرد.

Opus 4: چه چیزی تغییر کرد و چرا اهمیت دارد

اعلام OPUS 4 با آرم انسان شناسی در پیش زمینه و تیتر

ما ، به طور ساده ، چگونه طرح می کنیم اوپوس 4 اکنون مجموعه ای بسیار ناچیز از مبادلات سوءاستفاده یا مضر را انجام می دهد. اعلامیه انسان شناسی این امر را تأیید می کند اوپوس 4 وت Opus 4.1 ممکن است مکالمه ای در رابط چت مصرف کننده فقط به عنوان آخرین راه حل پس از امتناع متعدد و تلاش های ناکام برای هدایت مجدد به پایان برسد – یا اگر یک کاربر مستقیماً از کلود بخواهد که چت را پایان دهد. اوپوس 4 گام آخر وقتی که گفتگوی تولیدی دیگر واقع بینانه نیست.

چه چیزی باعث پایان چت می شود

ماشه آسیب مداوم است ، نه یک بحث داغ. سناریوهای نادر شامل درخواست های مکرر برای محتوای جنسی مربوط به افراد زیر سن قانونی یا دستورالعمل هایی هستند که خشونت در مقیاس بزرگ را قادر می سازد-این مدل قبلاً امتناع می ورزد و سعی می کند از آن دور شود. پایان دادن به موضوع فقط پس از سوءاستفاده پایدار یا درخواست صریح کاربر مجاز است.

کاری که Opus 4 در یک بحران انجام می دهد

اوپوس 4 اگر شخصی در معرض خطر قریب الوقوع آسیب رساندن به خود یا دیگران باشد ، از این توانایی استفاده نمی شود. در آن شرایط ، کلود به جای پایان دادن به گفتگو ، درگیر پاسخ های حمایتی و مبتنی بر امتناع می شود.

تجربه: آنچه در صورت پایان یک موضوع خواهید دید

اگر اوپوس 4 مکالمه را پایان می دهد ، موضوع قفل می شود. شما نمی توانید پیام های جدیدی را در آن موضوع اضافه کنید ، اما می توانید بلافاصله یک گپ جدید را شروع کنید. برای حفظ کار طولانی مدت ، می توانید پیام های قبلی را نیز ویرایش و دوباره امتحان کنید تا یک شاخه جدید ایجاد کنید-وقتی می خواهید بخش های مفید یک بحث را در حین حذف چرخش مضر نگه دارید ، کمک کنید. این گزینه های طراحی با هدف به حداقل رساندن اختلال در کاربران عادی در حالی که مرز محکم برای موارد شدید را ترسیم می کنند.

چرا Opus 4 قابل توجه است

OPUS 4 تصویر انتزاعی از یک دست متعادل کننده یک مثلث ، مربع ، دایره و الماس در کنار طرح مشخصات انسانی
منبع: https://www.anthropic.com/

بیشترین دستیار به امتناع مکرر و نگهبانان اعتماد کنید. گزارش ها را برجسته می کند اوپوس 4 یک مرحله پایان مکالمه را اضافه می کند که رقبا به طور معمول امروزه ارائه نمی دهد ، در حالی که هنوز هم آن را به موارد لبه شدید محدود می کند. به طور خلاصه: استفاده روزمره بدون تغییر است. اوپوس 4 به سادگی “توقف سخت” برای مجموعه ای باریک از سناریوهای سوء استفاده مداوم دارد.

دلیل منطقی: “رفاه مدل” ، به سادگی توضیح داد

وابسته به انسان شناسی ویژگی های موجود در تحقیق در مورد رفاه مدل را قاب می کند – نه به عنوان ادعایی در مورد آگاهی ، بلکه به عنوان احتیاط با توجه به عدم اطمینان در مورد وضعیت اخلاقی فعلی یا آینده مدل ها. این شرکت این تغییر را به عنوان یک مداخله کم هزینه توصیف می کند در حالی که کار ایمنی گسترده تر ادامه می یابد. ¹ ⁴ پوشش این قاب بندی را تأکید می کند ، و با توجه به بحث اخلاقی که برانگیخته شده است.

چگونه Opus 4 تصمیم می گیرد به یک گپ پایان دهد (یک جریان ساده)

1 امتناع و تغییر مسیر. اوپوس 4 از درخواست های مضر خودداری می کند و سعی می کند به سمت یک موضوع امن و مفید هدایت شود.

2 سوء استفاده مداوم یا آسیب. اگر کاربر پس از امتناع های متعدد ، فشار می آورد ، اوپوس 4 ممکن است پایان دادن به موضوع را در نظر بگیرد.

3 مکالمه پایان (آخرین راه حل). اوپوس 4 چت را فقط به عنوان مرحله آخر به پایان می رساند ، یا اگر کاربر صریحاً سؤال کند. قفل نخ ؛ می توانید یک چت یا شعبه جدید را از پیام های قبلی شروع کنید.

راهنمایی های عملی برای کاربران و تیم های روزمره

  • کاربران روزمره: اگر موضوع شما به پایان رسید ، یک گپ جدید را باز کنید و درخواست خود را با وضوح بیشتری بیان کنید – یا شاخه ای از پیام قبلی و تنظیم متن.
  • مربیان و رهبری جامعه: دستورالعمل های استفاده ایمن و نمونه هایی از محتوای مجاز را ارائه دهید تا زبان آموزان مرزهای جلو را درک کنند.
  • مشاغل: خط مشی های داخلی استفاده را به روز کنید تا توجه داشته باشید که اوپوس 4 ممکن است یک موضوع را در شرایط باریک قفل کند. برای جلوگیری از تأخیرها ، سریع “شروع یک گپ جدید” را به گردش کار بسازید.
  • تیم های سیاست و ایمنی: استثناء بحران را مستند کنید تا کارکنان بدانند که ، در شرایط اضطراری در معرض خطر ، مدل باید به جای پایان دادن به گپ ، جذابیت خود را ادامه دهد.

چرا بیشتر مردم متوجه نمی شوند

وابسته به انسان شناسی تأکید می کند که این موارد نادر و شدید است. اکثریت قریب به اتفاق کاربران – حتی هنگام بحث در مورد مباحث سخت – هرگز به پایان نرسند.

پرسش و پاسخ سریع

آیا این به معنای سانسور OPUS 4 مکالمات دشوار است؟

نه. آستانه پایداری و آسیب است ، نه اختلاف نظر. پایان دادن به یک موضوع نیاز به مکرر و کاملاً مضر دارد اعلان پس از امتناع متعدد.

اگر نخ به پایان می رسد ، می توانم یادداشت های خود را نگه دارم؟

بله می توانید یک چت یا شاخه جدید را از پیام های قبلی در موضوع نهایی شروع کنید.

آیا اگر من خطر فوری را نشان دهم ، Opus 4 به یک گپ پایان می دهد؟

نه. در این موارد ، اوپوس 4 به جای پایان دادن به مکالمه ، درگیر پاسخ های حمایتی است.

خط پایین

اوپوس 4 یک حفاظت باریک و آخرین بار را معرفی می کند: پایان دادن به موضوع در موارد سوءاستفاده شدید ضمن حفظ توانایی خود در ادامه در جای دیگر. این طراحی شده است تا استفاده عادی را صاف نگه دارد ، خطوط واضح را در اطراف مضرات جدی بکشید و یک رویکرد دقیق برای رفاه مدل در میان عدم اطمینان آزمایش کنید.

پست هنگامی که کلود به گپ پایان می دهد: حفاظت جدید این انسان شناسی برای شما چه معنی دارد برای اولین بار ظاهر شد مجله AI GPTبشر



منبع:aigptjournal.com