چگونه فناوری واترمارک گوگل محتوای تولید شده توسط هوش مصنوعی را شناسایی می کند


نویسنده(های): لمپرینی پاپارگری

در ابتدا منتشر شد به سمت هوش مصنوعی.

در اکتبر 2024، ابزار SynthID Google DeepMind برای واترمارک کردن متن های تولید شده با هوش مصنوعی به عنوان منبع باز منتشر شد که گامی مهم به جلو در شفافیت هوش مصنوعی بود. این ابزار در پاسخ به نگرانی‌های فزاینده در مورد تمایز محتوای تولید شده توسط هوش مصنوعی پدیدار شد، زیرا ابزارهایی مانند ChatGPT در OpenAI و Gemini Google اکنون متن، تصاویر و حتی صوتی را تولید می‌کنند که به‌طور فزاینده‌ای به سختی می‌توان آنها را از محتوای ساخته شده توسط انسان متمایز کرد. با توجه به اینکه سیاستگذاران و جامعه مدنی خواستار شناسایی قابل اعتماد محتوای هوش مصنوعی هستند، SynthID یک پیشرفت مهم در رسیدگی به مسائل مربوط به اطلاعات غلط و صحت مبتنی بر هوش مصنوعی است.

قابل توجه، مرکز آموزش دیجیتال اروپا (EDEH) و آن تیم “هوش مصنوعی قابل توضیح”. نقش مهمی در پیشبرد شفافیت هوش مصنوعی در محیط های آموزشی ایفا کرده اند. هوش مصنوعی قابل توضیح (XAI) به سیستم‌های هوش مصنوعی اطلاق می‌شود که به‌روشنی نحوه اتخاذ تصمیم‌ها و توصیه‌ها را نشان می‌دهند، نه اینکه به عنوان یک «جعبه سیاه» با فرآیندهای پنهان عمل کنند. هدف آنها از طریق همکاری با شرکت‌ها و سازمان‌های فناوری، ارتقای سواد دیجیتال و افزایش شفافیت در بخش‌های آموزشی و عمومی اروپا، تقویت شیوه‌های هوش مصنوعی اخلاقی و ایجاد اعتماد در محیط‌های آموزشی و دیجیتال است.

کارگاه اجتماعی در مورد هوش مصنوعی قابل توضیح (XAI) در آموزش.

ارزیابی ابزارهای تشخیص هوش مصنوعی: معیارهای فنی و خط مشی کلیدی

پیشرفت سریع هوش مصنوعی مولد نیاز فوری به ابزارهایی ایجاد کرده است که بتوانند محتوای تولید شده توسط هوش مصنوعی را به طور قابل اعتماد شناسایی کنند. اثربخشی هر ابزار تشخیص به مجموعه ای از معیارهای فنی و خط مشی اساسی بستگی دارد:

  • دقت: یک ابزار تشخیص باید به طور قابل اعتمادی بین محتوای ساخته شده توسط انسان و تولید شده توسط هوش مصنوعی، با حداقل مثبت و منفی کاذب تمایز قائل شود. برای اهداف شفاف‌سازی و توضیح‌پذیری، ابزار باید پاسخ‌های ظریف (مثلاً امتیاز احتمال) را به جای یک پاسخ باینری ساده ارائه دهد.
  • استحکام در برابر فرار: روش‌های تشخیص باید در برابر دستکاری یا دستکاری مقاومت کنند، زیرا بازیگران با انگیزه ممکن است سعی کنند محتوای هوش مصنوعی را تغییر دهند تا آن را ساخته‌ی انسان جلوه دهند، مانند ترجمه یا ترجمه.
  • حفظ کیفیت: تکنیک های تشخیص باید از کاهش کیفیت محتوای تولید شده توسط هوش مصنوعی جلوگیری کنند. ابزارهایی که عمداً کیفیت را کاهش می‌دهند تا محتوا قابل تشخیص باشد، ممکن است مانع از پذیرش توسعه‌دهندگان متمرکز بر تجربه کاربر شود.
  • جهانی و حریم خصوصی: در حالت ایده آل، یک ابزار تشخیص باید جهانی باشد، به این معنی که می تواند برای هر مدل هوش مصنوعی بدون نیاز به همکاری فعال از توسعه دهنده اعمال شود. حریم خصوصی به همان اندازه مهم است. هر روش تشخیصی باید به حریم خصوصی داده های کاربر احترام بگذارد.

جنبه های اصلی واترمارکینگ

واترمارکینگ شامل تعبیه نشانگرهای قابل شناسایی در محتوا برای نشان دادن منشأ آن است، روشی که مدت هاست در رسانه های دیجیتال مانند عکس و صدا استفاده می شود. با هوش مصنوعی، واترمارکینگ به عنوان راهی مناسب برای علامت‌گذاری محتوا برای شناسایی بعدی، با رفع نگرانی‌های مربوط به اصالت، مورد توجه قرار گرفته است. در اینجا چند تکنیک کلیدی واترمارکینگ و نحوه عملکرد آنها در تئوری و عمل آورده شده است:

واترمارک آماری: الگوهای غیرعادی آماری را در متن یا سایر محتواها برای ایجاد امضای ظریف و قابل خواندن توسط ماشین قرار می دهد.

  • مزایا: امکان شناسایی دقیق را بدون به خطر انداختن خوانایی فراهم می کند و با تغییرات نور به خوبی کار می کند.
  • محدودیت ها: حساس به تغییرات گسترده (به عنوان مثال، ترجمه، ترجمه)، که می تواند علامت را حذف یا ضعیف کند.

واترمارک های مرئی و نامرئی: واترمارک های قابل مشاهده، مانند لوگوها یا برچسب ها، بلافاصله قابل تشخیص هستند اما می توانند تجربه کاربر را مختل کنند. واترمارک های نامرئی الگوهایی را در محتوا جاسازی می کنند که توسط کاربران غیرقابل شناسایی هستند اما می توانند با ابزارهای تشخیص تخصصی شناسایی شوند.

  • مزایا: واترمارک های نامرئی از تغییر ظاهر محتوا جلوگیری می کنند و تجربه کاربری یکپارچه را ارائه می دهند.
  • محدودیت ها: کاربران پیشرفته ممکن است بتوانند این نشانگرها را حذف یا تغییر دهند، به خصوص اگر روش واترمارکینگ را درک کنند.

گوگل SynthID از یک رویکرد واترمارک آماری برای تغییر ماهرانه احتمالات توکن استفاده می کند تولید متن، یک امضای نامرئی و قابل خواندن توسط ماشین باقی می گذارد. واترمارک نامرئی SynthID کیفیت محتوا را حفظ می کند و در عین حال مواد تولید شده توسط هوش مصنوعی را علامت گذاری می کند

مروری بر رویکردهای تشخیص هوش مصنوعی

  1. رویکرد مبتنی بر بازیابی: این روش شامل ایجاد و نگهداری یک پایگاه داده از تمام محتوای تولید شده است تا بتوان متن جدید را برای مطابقت با آن بررسی کرد.
  • مزایا: برای تشخیص تطابق دقیق موثر است و برای موارد استفاده خاص با ارزش بالا قابل اعتماد است.
  • معایب: نیاز به فضای ذخیره سازی گسترده و به روز رسانی مداوم دارد که نگرانی های مربوط به مقیاس پذیری و حفظ حریم خصوصی را افزایش می دهد. سیستم های مبتنی بر بازیابی می توانند در مقیاس های بزرگ غیر عملی باشند.

2. تشخیص پس از حادثه: این تکنیک کاربرد دارد یادگیری ماشینی طبقه‌بندی‌کننده‌ها به متن پس از تولید، ویژگی‌های معمولی را که با هوش مصنوعی نوشته شده در مقابل مواد نوشته شده توسط انسان ارزیابی می‌کنند. این بر تحلیل الگوها در نحو، انتخاب کلمه و ساختار متکی است.

  • مزایا: تشخیص Post-hoc در ایجاد متن دخالتی ندارد و در مدل های مختلف هوش مصنوعی انعطاف پذیر است.
  • معایب: از نظر محاسباتی سخت، با عملکرد ناسازگار در محتوای خارج از دامنه یا بسیار ویرایش شده. هنگامی که محتوا دستخوش تغییرات اساسی می شود، دقت تشخیص می تواند به میزان قابل توجهی کاهش یابد.

3. واترمارک متن: SynthID در این دسته قرار می گیرد که نشانگرها را مستقیماً در متن تولید شده در زمان ایجاد قرار می دهد. واترمارکینگ متن چندین زیرمجموعه دارد:

3.1 واترمارک مولد: احتمالات رمز را در طول تولید متن تنظیم می کند تا یک “امضای” نامرئی را بدون تغییر کیفیت متن معرفی کند.

  • مزایا: خوانایی را حفظ می کند و در برابر ویرایش های جزئی قوی است. کمترین تاثیر بر کیفیت متن
  • معایب: آسیب پذیر به ویرایش های قابل توجه، مانند بازنویسی یا ترجمه های گسترده، که ممکن است واترمارک را حذف کند.

3.2 واترمارک مبتنی بر ویرایش: متن را پس از تولید با افزودن کاراکترها یا نمادهای خاص تغییر می‌دهد.

  • مزایا: به راحتی قابل تشخیص و سریع اجرا می شود.
  • معایب: به وضوح متن را تغییر می دهد و به طور بالقوه بر خوانایی و تجربه کاربر تأثیر می گذارد.

3.3 واترمارک داده محور: واترمارک ها را در داده های آموزشی به طوری که توالی ها یا عبارات خاصی فقط در صورت درخواست ظاهر می شوند.

  • مزایا: برای جلوگیری از استفاده غیرمجاز در هنگام ادغام از مرحله آموزش موثر است.
  • معایب: محدود به درخواست های خاص، با نشانگرهای قابل مشاهده که ممکن است ظرافت را به خطر بیندازند.

SynthID از واترمارک مولد برای جاسازی دقیق نشانگرها در طول تولید متن استفاده می‌کند و ضمن حفظ کیفیت متن، امضای غیرقابل شناسایی را تضمین می‌کند. این رویکرد تعادلی بین تشخیص و قابلیت استفاده ایجاد می‌کند و پیشرفت قابل توجهی را در واترمارکینگ برای هوش مصنوعی نشان می‌دهد.

SynthID چگونه کار می کند

فناوری واترمارک SynthID به کار می‌رود دو شبکه عصبی برای تعبیه و شناسایی یک واترمارک نامرئی. برای متن، این مکانیسم با تغییر نامحسوس احتمالات توکن در طول تولید متن کار می کند. مدل‌های زبان بزرگ (LLM) متنی را در یک زمان تولید می‌کنند و به هر نشانه بر اساس زمینه، احتمالی را اختصاص می‌دهند. اولین شبکه SynthID تنظیمات کوچکی را برای این احتمالات انجام می دهد و یک امضای واترمارکی ایجاد می کند که نامرئی می ماند و خوانایی و روان بودن متن را حفظ می کند.

برای تصاویر، اولین شبکه عصبی چند پیکسل در تصویر اصلی را تغییر می دهد تا یک الگوی غیرقابل کشف را جاسازی کند. سپس شبکه دوم این الگو را هم در متن و هم در تصاویر اسکن می‌کند و به آن اجازه می‌دهد به کاربران اطلاع دهد که آیا واترمارکی را تشخیص می‌دهد، مشکوک است یا هیچ کدام را پیدا نمی‌کند.

فرآیند تشخیص واترمارک توزیع احتمال متن واترمارک شده و بدون واترمارک را با هم مقایسه می کند و امضای باقی مانده از واترمارک را شناسایی می کند. از طریق آزمایش در مقیاس بزرگ، Google DeepMind اثربخشی SynthID را تأیید کرد: در برنامه Gemini، که در آن بیش از 20 میلیون کاربر ناآگاهانه متن واترمارک و بدون واترمارک را رتبه‌بندی کردند، بازخورد تفاوت کیفیت قابل توجهی بین این دو نشان نداد. این نشان می دهد که فرآیند واترمارک SynthID بدون به خطر انداختن روان بودن یا قابلیت استفاده متن موثر است.

SynthID از دو شبکه عصبی برای جاسازی و تشخیص واترمارک در تصاویر استفاده می کند. اولین شبکه تصویر اصلی را پردازش می کند و یک نسخه تقریباً یکسان را با تغییرات جزئی در چند پیکسل ایجاد می کند و الگویی را در خود جای می دهد که برای چشم انسان نامرئی باقی می ماند. سپس شبکه دوم این الگو را اسکن می‌کند و به کاربران نشان می‌دهد که آیا یک واترمارک شناسایی شده است، احتمالاً وجود دارد یا وجود ندارد.

نقاط قوت و محدودیت های SynthID و Watermarking

رویکرد واترمارک نامرئی SynthID ابزار قدرتمندی برای علامت گذاری محتوای تولید شده توسط هوش مصنوعی فراهم می کند، اما با چالش هایی مواجه است، به ویژه به عنوان بخشی از یک راه حل جامع برای شفافیت هوش مصنوعی. نقاط قوت و محدودیت های کلیدی عبارتند از:

  • واترمارک SynthID است انعطاف پذیر با تغییرات جزئی، مانند بازنویسی یا برش جزئی، که آن را برای محتوای کمی اصلاح شده قوی می کند.
  • SynthID با خروجی های بسیار قابل پیش بینی مبارزه می کندمانند گزاره های واقعی (مثلاً “پایتخت فرانسه پاریس است”) یا کد، که در آن علامت را نمی توان بدون تأثیر بر دقت جاسازی کرد.
  • در حالی که در برابر تغییرات گاه به گاه موثر است، علامت SynthID می تواند توسط کاربران با آگاهی از عملکرد آن به خطر بیفتد، به ویژه در مواردی که هدف دشمنان پیچیده حذف یا پنهان کردن واترمارک است.

با توجه به این محدودیت‌ها، SynthID زمانی که با روش‌های تشخیص دیگر جفت شود، بهترین عملکرد را دارد. ترکیب آن با روش‌های مبتنی بر بازیابی یا پس از آن می‌تواند دقت و انعطاف‌پذیری کلی تشخیص را افزایش دهد، به‌ویژه در کاربردهای پرمخاطره مانند آموزش یا تشخیص اطلاعات غلط.

ملاحظات سیاست و حاکمیت برای واترمارک

استقرار SynthID به عنوان یک ابزار منبع باز بخشی از یک روند بزرگتر به سمت ایجاد استانداردهای شفافیت هوش مصنوعی است. سیاست گذاران در حال بررسی راه هایی برای ارتقای پاسخگویی هستند، از جمله الزامات واترمارک در قوانین و موافقت نامه های بین المللی. حاکمیت مؤثر واترمارک هوش مصنوعی مستلزم توجه به چندین ملاحظات کلیدی است:

∙ با پیشرفت تحقیقات واترمارکینگ، تکنیک های استاندارد شده به همسو کردن ذینفعان مختلف کمک خواهد کرد و اقدامات شفافیت هوش مصنوعی را سازگارتر خواهد کرد.

∙ یک سازمان متمرکز می تواند یک رجیستری از پروتکل های واترمارکینگ را مدیریت کند و با ارائه یک سیستم تشخیص را ساده کند. پلت فرم استاندارد برای اینکه کاربران منشأ محتوا را تأیید کنند.

∙ سیاست گذاران باید از رعایت روش های واترمارک اطمینان حاصل کنند حریم خصوصی کاربر و امنیت داده ها. این شامل تعریف اطلاعاتی است که می‌تواند در واترمارک‌ها جاسازی شود و مدیریت داده‌ها توسط سرویس‌های تشخیص شخص ثالث را تنظیم می‌کند.

یک رویکرد متعادل و لایه‌ای که روش‌های تشخیص چندگانه را ترکیب می‌کند، ممکن است عملی‌ترین استراتژی برای پرداختن به چالش‌های پیچیده ناشی از محتوای مولد هوش مصنوعی باشد.

نتیجه گیری: نقش SynthID در ایجاد شفافیت هوش مصنوعی

SynthID یک گام دیگر به جلو در شفافیت هوش مصنوعی است، اما واترمارک به تنهایی نمی تواند مسئولیت پذیری کامل برای محتوای تولید شده توسط هوش مصنوعی را تضمین کند. همانطور که هوش مصنوعی به طور فزاینده ای در تولید متن، تصاویر و رسانه های واقعی مهارت پیدا می کند، یک رویکرد چند لایه برای تأیید محتوا ضروری است. SynthID نقطه شروعی را فراهم می کند و به کاربران ابزاری برای شناسایی مواد تولید شده توسط هوش مصنوعی و جلوگیری از سوء استفاده می دهد. با این حال، در حالت ایده‌آل باید بخشی از یک اکوسیستم بزرگتر از چک‌ها و تعادل‌ها باشد تا از پاسخگویی قوی هوش مصنوعی اطمینان حاصل شود.

برای اصالت واقعی محتوا، پادمان های اضافی باید بررسی شود. برای مثال، بررسی حقایق می‌تواند به تأیید صحت اطلاعات کمک کند، در حالی که چارچوب‌های تأیید محتوای استاندارد، تشخیص مداوم را در بین پلتفرم‌ها و ابزارها تضمین می‌کند. علاوه بر این، اقدامات نظارتی می‌تواند به اطمینان حاصل شود که محتوای تولید شده توسط هوش مصنوعی برچسب‌گذاری شده و قابل ردیابی است و به کاربران این امکان را می‌دهد تا اعتبار و منشأ اطلاعاتی را که با آن مواجه می‌شوند ارزیابی کنند.

در این چشم انداز در حال تحول، SynthID می تواند به عنوان ابزاری برای شفافیت هوش مصنوعی عمل کند با ارائه روشی قابل اعتماد به کاربران برای تمایز بین محتوای تولید شده توسط انسان و هوش مصنوعی. همانطور که روش های واترمارکینگ و مکمل به طور گسترده پذیرفته می شوند، ممکن است شاهد ظهور یک اکوسیستم دیجیتال شفاف تر و پاسخگوتر باشیم که شیوه های هوش مصنوعی مسئولانه را تشویق می کند. با تجهیز کاربران به ابزارهایی برای تأیید صحت محتوای دیجیتال، SynthID و فناوری‌های مشابه می‌توانند به یک محیط آنلاین امن‌تر و قابل اعتمادتر کمک کنند.

علاقه مند به کسب اطلاعات بیشتر در مورد SynthID هستید؟ بخوانید اینجا مقاله

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/artificial-intelligence/how-googles-watermarking-technology-identifies-ai-generated-content