ساخت یک برنامه RAG ساده با استفاده از LlamaIndex


ساخت یک برنامه RAG ساده با استفاده از LlamaIndexساخت یک برنامه RAG ساده با استفاده از LlamaIndex

تصویر توسط نویسنده

در این آموزش، ما به بررسی Retrieval-Augmented Generation (RAG) و چارچوب هوش مصنوعی LlamaIndex می پردازیم. ما یاد خواهیم گرفت که چگونه از LlamaIndex برای ایجاد یک برنامه مبتنی بر RAG برای پرسش و پاسخ بر روی اسناد خصوصی استفاده کنیم و برنامه را با گنجاندن بافر حافظه تقویت کنیم. این LLM را قادر می‌سازد تا با استفاده از متن از هر دو سند و تعاملات قبلی، پاسخ ایجاد کند.

RAG در LLM چیست؟

Retrieval-Augmented Generation (RAG) یک روش پیشرفته است که برای بهبود عملکرد مدل های زبان بزرگ (LLM) با ادغام منابع دانش خارجی در فرآیند تولید طراحی شده است.

RAG شامل دو مرحله اصلی است: بازیابی و تولید محتوا. در ابتدا، اسناد یا داده‌های مربوطه از پایگاه‌های اطلاعاتی خارجی بازیابی می‌شوند، که سپس برای فراهم کردن زمینه برای LLM استفاده می‌شوند، و اطمینان حاصل می‌شود که پاسخ‌ها بر اساس جدیدترین اطلاعات و دامنه خاص موجود است.

LlamaIndex چیست؟

LlamaIndex یک چارچوب هوش مصنوعی پیشرفته است که برای افزایش قابلیت‌های مدل‌های زبان بزرگ (LLM) با تسهیل یکپارچه‌سازی یکپارچه با منابع داده متنوع طراحی شده است. این نرم افزار از بازیابی داده ها از بیش از 160 فرمت مختلف، از جمله API ها، فایل های PDF، و پایگاه های داده SQL پشتیبانی می کند و آن را برای ساخت برنامه های کاربردی پیشرفته هوش مصنوعی بسیار متنوع می کند.

ما حتی می‌توانیم یک برنامه هوش مصنوعی چند وجهی و چند مرحله‌ای کامل بسازیم و سپس آن را در سرور مستقر کنیم تا پاسخ‌های بسیار دقیق و مختص دامنه ارائه کنیم. در مقایسه با سایر چارچوب‌ها مانند LangChain، LlamaIndex راه‌حل ساده‌تری با توابع داخلی ارائه می‌دهد که برای انواع مختلف برنامه‌های LLM طراحی شده است.

ساخت برنامه های RAG با استفاده از LlamaIndex

در این بخش، یک برنامه هوش مصنوعی می سازیم که فایل های مایکروسافت ورد را از یک پوشه بارگذاری می کند، آنها را به جاسازی تبدیل می کند، آنها را در فروشگاه برداری فهرست می کند و یک موتور جستجوی ساده می سازد. پس از آن، ما یک چت بات RAG مناسب با تاریخچه با استفاده از ذخیره برداری به عنوان یک بازیابی، LLM و بافر حافظه می سازیم.

راه اندازی

تمام بسته های پایتون لازم را برای بارگیری داده ها و برای OpenAI API نصب کنید.

LLM و مدل جاسازی را با استفاده از توابع OpenAI آغاز کنید. ما از جدیدترین مدل‌های “GPT-4o” و “Text-Embedding-3-Small” استفاده خواهیم کرد.

هر دو مدل LLM و embedding را روی global قرار دهید تا وقتی تابعی را فراخوانی می کنیم که به LLM یا embedding نیاز دارد، به طور خودکار از این تنظیمات استفاده کند.

بارگذاری و نمایه سازی اسناد

داده ها را از پوشه بارگیری کنید، آن را به جاسازی تبدیل کنید و در فروشگاه برداری ذخیره کنید.

Building Query Engine

لطفاً فروشگاه برداری را به یک موتور جستجو تبدیل کنید و شروع به پرسیدن سؤال در مورد اسناد کنید. این اسناد شامل وبلاگ‌هایی است که در ژوئن در مورد تسلط یادگیری ماشین توسط نویسنده عبید علی عوان منتشر شده است.

و پاسخ دقیق است.

موضوعات رایج وبلاگ ها حول محور افزایش دانش است و مهارت ها در یادگیری ماشینی آنها بر تامین منابعی از این قبیل تمرکز می کنند به عنوان کتاب های رایگان، پلتفرم ها برای همکاری، و مجموعه داده هایی برای کمک به افراد برای تعمیق درک خود از الگوریتم های یادگیری ماشین، همکاری موثر در پروژه ها، و کسب تجربه عملی از طریق داده های دنیای واقعی. این منابع برای هر دو مبتدی در نظر گرفته شده است و متخصصانی که به دنبال ایجاد یک پایه قوی هستند و حرفه خود را پیش ببرند در زمینه یادگیری ماشین

ساخت برنامه RAG با حافظه بافر

برنامه قبلی ساده بود. بیایید یک ربات چت پیشرفته تر با ویژگی تاریخ ایجاد کنیم.

ما چت بات را با استفاده از یک بازیابی، یک بافر حافظه چت و یک مدل GPT-4o خواهیم ساخت.

پس از آن، ربات چت خود را با پرسیدن سوالاتی در مورد یکی از پست های وبلاگ آزمایش می کنیم.

بسیار دقیق و دقیق است.

بر اساس اسناد ارائه شده، “دوره عمیق RL” توسط Hugging Face است بسیار توصیه می شود برای تسلط بر یادگیری تقویتی این دوره است به خصوص مناسب است برای مبتدیان و هر دو اصل را پوشش می دهد و تکنیک های پیشرفته یادگیری تقویتی شامل موضوعاتی از این قبیل است به عنوان یادگیری Q، یادگیری عمیق Q، گرادیان خط مشی، عوامل ML، روش‌های منتقد بازیگر، سیستم‌های چند عاملی، و موضوعات پیشرفته مانند RLHF (Reinforcement Learning از بازخورد انسانی)، ترانسفورماتورهای تصمیم، و MineRL. دوره است طراحی شده تا ظرف یک ماه تکمیل شود و آزمایش عملی را ارائه می دهد با مدل ها، استراتژی هایی برای بهبود نمرات، و تابلوی امتیازات برای پیگیری پیشرفت

بیایید سوالات بعدی را بپرسیم و در مورد دوره بیشتر بدانیم.

اگر در اجرای کد بالا مشکل دارید، لطفاً به نوت بوک Deepnote مراجعه کنید: ساخت برنامه RAG با استفاده از LlamaIndex.

نتیجه گیری

ساخت و استقرار برنامه های کاربردی هوش مصنوعی توسط LlamaIndex آسان شده است. شما فقط باید چند خط کد بنویسید و تمام.

گام بعدی در سفر یادگیری شما ساختن یک برنامه چت بات مناسب با استفاده از Gradio و استقرار آن بر روی سرور خواهد بود. برای ساده‌تر کردن زندگی‌تان، می‌توانید Llama Cloud را نیز بررسی کنید.

در این آموزش، با LlamaIndex و نحوه ساختن یک برنامه RAG آشنا شدیم که به شما امکان می دهد از اسناد خصوصی خود سؤال بپرسید. سپس، ما یک چت ربات RAG مناسب ساختیم که با استفاده از اسناد خصوصی و تعاملات چت قبلی، پاسخ‌ها را تولید می‌کند.

با راهنمای مبتدیان برای علم داده شروع کنید!

راهنمای مبتدیان برای علم دادهراهنمای مبتدیان برای علم داده

طرز فکر موفقیت در پروژه های علم داده را بیاموزید

… با استفاده از حداقل ریاضی و آمار، مهارت خود را از طریق مثال های کوتاه در پایتون به دست آورید

در کتاب الکترونیکی جدید من نحوه انجام این کار را کشف کنید:
راهنمای مبتدیان برای علم داده

فراهم می کند آموزش های خودآموز با همه کد کار در پایتون تا شما را از یک تازه کار به یک متخصص تبدیل کند. به شما نشان می دهد که چگونه یافتن نقاط پرت، تایید نرمال بودن داده ها، یافتن ویژگی های مرتبط، کنترل چولگی، بررسی فرضیه هاو خیلی بیشتر…همه برای حمایت از شما در ایجاد یک روایت از یک مجموعه داده.

سفر علم داده خود را با تمرینات عملی شروع کنید

ببینید چه چیزی در داخل است



منبع: machinelearningmastery.com

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *