نسل افزوده شده حافظه پنهان (CAG) در مقابل نسل افزوده شده با بازیابی (RAG)

نویسنده(ها): طلحه نظر

در ابتدا منتشر شد به سمت هوش مصنوعی.

نسل افزوده حافظه پنهان (CAG) در مقابل نسل افزوده شده بازیابی (RAG) — تصویر توسط نویسنده

در چشم انداز در حال تحول از مدل های زبان بزرگ (LLMs)، دو تکنیک مهم برای رفع محدودیت‌های ذاتی آنها پدیدار شده‌اند: تولید حافظه پنهان (CAG) و نسل افزوده شده بازیابی (RAG). این رویکردها نه تنها قابلیت‌های LLM را افزایش می‌دهند، بلکه به چالش‌هایی مانند کارایی، ارتباط و مقیاس‌پذیری نیز می‌پردازند. در حالی که آنها به اهداف کلی مشابهی خدمت می کنند، مکانیسم های اساسی و موارد استفاده آنها عمیقاً متفاوت است. در این داستان، آنچه که آنها را منحصربه‌فرد می‌کند، مزایای آن‌ها، کاربردهای عملی آن‌ها و اینکه چه چیزی ممکن است برای سناریوهای مختلف مناسب باشد را بررسی خواهیم کرد.

تنظیم مرحله: چرا افزایش اهمیت دارد

تصور کنید با یک LLM در مورد موضوعات پیچیده ای مانند تحقیقات پزشکی یا رویدادهای تاریخی چت می کنید. علیرغم آموزش گسترده اش، گاهی اوقات توهم ایجاد می کند – اطلاعات نادرست یا ساختگی تولید می کند. این یک محدودیت مستند حتی در مدل های پیشرفته است.

دو راه حل نوآورانه برای رفع این کاستی ها معرفی شده است:

نسل افزوده شده حافظه پنهان (CAG): طراحی شده برای افزایش کارایی و حفظ زمینه با ذخیره و استفاده مجدد از خروجی های مربوطه.
Retrieval-Augmented Generation (RAG): با بازیابی اطلاعات خارجی در حین استنتاج، بر خروجی های زمینی در دانش به روز دنیای واقعی متمرکز شده است.

بیایید به این روش‌شناسی بپردازیم و مکانیسم‌های آن‌ها را با مثال‌ها و تجسم‌هایی برای روشن کردن چیزها باز کنیم.

Cache-Augmented Generation (CAG): ارتقاء حافظه

CAG چیست؟
در هسته خود، CAG یک مدل زبان را قادر می‌سازد تا خروجی‌های تولید شده یا نمایش‌های میانی را در یک «کش» در طول تعاملات ذخیره کند. این حافظه نهان یک حافظه کوتاه مدت است که به مدل اجازه می دهد تا محاسبات گذشته را به نحو احسن استفاده کند.

چگونه کار می کند:
هنگام ایجاد پاسخ، مدل حافظه پنهان خود را بررسی می کند تا ببیند آیا قبلاً با پرس و جوهای مشابه مواجه شده است یا خیر. اگر مطابقت پیدا شود، مدل به جای شروع از ابتدا، پاسخ ذخیره شده را بازیابی و اصلاح می کند.

مثال: چت ربات های پشتیبانی مشتری

تصور کنید در حال اداره یک کسب و کار هستید و مشتریان اغلب می پرسند:

“سیاست بازگشت شما چیست؟”
“چگونه سفارش خود را پیگیری کنم؟”

به جای اینکه هر بار پاسخ‌ها را بازسازی کند، سیستم CAG ربات چت، پاسخ‌های از پیش تولید شده را از حافظه پنهان خود دریافت می‌کند و از پاسخ‌های سریع‌تر و پیام‌رسانی مداوم اطمینان می‌دهد.

مزایا:

کارایی: با اجتناب از پردازش اضافی، سربار محاسباتی را کاهش می دهد.
سازگاری: پاسخ های یکنواخت به پرس و جوهای تکراری یا مشابه را تضمین می کند.
مقرون به صرفه: با به حداقل رساندن کارهای تکراری در منابع صرفه جویی می شود.

معایب:

انعطاف پذیری محدود: اگر پرس و جوها از ورودی های حافظه پنهان منحرف شوند، ممکن است پاسخ ها کلی به نظر برسند.
مدیریت کش: به مکانیسم‌های قوی برای رسیدگی به ورودی‌های حافظه پنهان قدیمی یا نامربوط نیاز دارد.

Retrieval-Augmented Generation (RAG): دانش بر حسب تقاضا

RAG چیست؟
RAG به یک مدل قدرت می دهد تا اطلاعات خارجی را از پایگاه داده، موتور جستجو یا منابع دیگر در حین استنتاج واکشی کند. این تضمین می کند که محتوای تولید شده بر اساس داده های واقعی و به روز باقی بماند.

چگونه کار می کند:
در طول یک پرس و جو، مدل فرآیند خود را به دو مرحله تقسیم می کند:

اسناد یا داده های مربوطه را با استفاده از یک ماژول بازیابی بازیابی می کند.
با ترکیب اطلاعات بازیابی شده، پاسخ هایی را ایجاد می کند.

مثال: کمک پژوهشی دانشگاهی

فرض کنید محققی بپرسد:

آخرین یافته‌های محاسبات کوانتومی را خلاصه کنید.

یک مدل RAG-enabled مقالات یا مقالات اخیر در مورد محاسبات کوانتومی را از یک پایگاه داده متصل بازیابی می کند و خلاصه ای را بر اساس این اطلاعات ایجاد می کند. این امر خروجی های دقیق و جاری را تضمین می کند.

مزایا:

دقت: با ایجاد پاسخ در داده های واقعی، توهمات را کاهش می دهد.
مقیاس پذیری: از بازیابی در مقیاس بزرگ از مخازن وسیع دانش پشتیبانی می کند.
انعطاف پذیری: با نیازهای دانش پویا سازگار می شود.

معایب:

تأخیر: واکشی و پردازش داده های خارجی می تواند زمان پاسخ را کاهش دهد.
وابستگی به رتریورها: عملکرد به کیفیت و ارتباط داده های بازیابی شده بستگی دارد.
پیچیدگی یکپارچه سازی: به ادغام یکپارچه بین اجزای رتریور و ژنراتور نیاز دارد.

تفاوت های کلیدی بین CAG و RAG

یک آزمایش فکری تعاملی

بیایید تصور کنیم که در حال ساخت یک دستیار هوش مصنوعی برای یک شرکت فناوری هستید:

CAG با وظایف معمولی مانند پاسخ دادن به سیاست های منابع انسانی یا برنامه های تعطیلات شرکت مناسب است.
RAG ارزش قابل توجهی را برای پرس و جوهای پیچیده مانند تجزیه و تحلیل روند صنعت یا خلاصه کردن استراتژی های رقبا اضافه می کند.

CAG را به‌عنوان یک سیستم یادداشت دیجیتالی و RAG را به‌عنوان کتابداری که کتاب‌ها را از آرشیو می‌آورد، در نظر بگیرید. هر کدام بسته به نیاز شما جایگاه خود را دارند.

تصویر بزرگتر: ترکیب CAG و RAG

در حالی که CAG و RAG اغلب به عنوان تکنیک های مجزا مورد بحث قرار می گیرند، رویکردهای ترکیبی در حال افزایش است. به عنوان مثال، یک سیستم ممکن است از CAG برای ذخیره اسناد بازیابی شده مکرر و RAG برای ذخیره پرس و جوهای پویا استفاده کند و یک هم افزایی ایجاد کند که از هر دو نقطه قوت استفاده کند.

مثال: هوش مصنوعی مراقبت های بهداشتی

در یک محیط بهداشتی:

CAG می‌تواند دستورالعمل‌هایی را که معمولاً به آنها ارجاع داده می‌شود (مثلاً دستورالعمل‌های دوز) ذخیره کند.
RAG می‌تواند آخرین مطالعات پزشکی را برای پرسش‌های کمتر رایج یا جدید بازیابی کند.

چنین سیستم های ترکیبی کارایی و دقت را متعادل می کنند و آنها را برای کاربردهای پیچیده دنیای واقعی ایده آل می کند.

جوانب مثبت و منفی: یک دیدگاه کل نگر

جوانب مثبت:

پاسخ سریع برای کارهای تکراری
نیازهای محاسباتی کم
پیاده سازی آسان تر.

معایب:

اگر حافظه پنهان قدیمی باشد مستعد بی ربط بودن است.
سازگاری محدود با پرس و جوهای ظریف.

Retrieval-Augmented Generation (RAG)

جوانب مثبت:

پاسخ های واقعی واقعی را تولید می کند.
با پرس و جوهای متنوع و پویا سازگار می شود.
مناسب برای کارهای در مقیاس بزرگ و دانش فشرده.

معایب:

افزایش پیچیدگی و تاخیر.
وابستگی بیشتر به سیستم های خارجی

افکار نهایی

هر دو نسل افزوده شده با حافظه پنهان و نسل افزوده شده بازیابی، پیشرفت های هیجان انگیزی را در دنیای LLM نشان می دهند. چه در حال ساخت یک چت بات سریع و ثابت باشید یا یک دستیار بسیار آگاه، درک این تکنیک ها – و نقاط قوت و محدودیت های آنها – برای انتخاب درست بسیار مهم است.

همانطور که ما همچنان مرزهای هوش مصنوعی را پیش می بریم، مدل های هیبریدی که بهترین های CAG و RAG را با هم ترکیب می کنند، ممکن است به استاندارد تبدیل شوند و کارایی و دقت بی نظیری را ارائه دهند.

نقل قول ها:

لوئیس، پی، و همکاران. “نسل افزایش یافته بازیابی برای وظایف NLP دانش فشرده.” NeurIPS 2020
براون، سل، و همکاران. «مدل‌های زبان، یادگیرندگان کمی هستند.» مقاله OpenAI GPT-3، 2020
مقاله تحقیقاتی هوش مصنوعی: «نظرسنجی در مورد شبکه‌های عصبی تقویت‌شده حافظه: بینش‌های شناختی برای کاربردهای هوش مصنوعی» 2023

آیا پتانسیل را در ترکیب CAG و RAG برای پروژه بعدی هوش مصنوعی خود می بینید؟ نظرات خود را در نظرات به اشتراک بگذارید!

منتشر شده از طریق به سمت هوش مصنوعی

منبع: https://towardsai.net/p/artificial-intelligence/cache-augmented-generation-cag-vs-retrieval-augmented-generation-rag