Building Multimodal RAG کاربرد شماره 7: RAG چندوجهی با LangChain چندوجهی


نویسنده(های): یوسف حسنی

در ابتدا منتشر شد به سمت هوش مصنوعی.

این داستان فقط برای اعضا در اختیار ماست. برای دسترسی به تمام Medium ارتقا دهید.

تولید افزوده بازیابی چندوجهی (RAG) در حال تغییر نحوه مدیریت برنامه‌های هوش مصنوعی با اطلاعات پیچیده با ادغام قابلیت‌های بازیابی و تولید در انواع مختلف داده‌ها، مانند متن، تصاویر و ویدئو است.

بر خلاف RAG سنتی، که معمولاً بر بازیابی و تولید مبتنی بر متن تمرکز می‌کند، سیستم‌های RAG چندوجهی می‌توانند محتوای مرتبط را هم از منابع متنی و هم از منابع بصری برای تولید پاسخ‌های غنی‌تر و جامع‌تر به‌دست آورند.

این مقاله، هفتمین قسمت از سری برنامه های کاربردی RAG چندوجهی ساختمان ما، به ساخت سیستم های RAG چند وجهی با LangChain می پردازد.

ما تمام ماژول های ایجاد شده در مقالات قبلی را در زنجیره های LangChain با استفاده از روش های RunnableParallel، RunnablePassthrough و RunnableLambda از LangChain قرار می دهیم.

این مقاله هفتمین سری از برنامه های کاربردی RAG چند وجهی ساختمان است:

مقدمه ای بر برنامه های کاربردی RAG چندوجهی (منتشر شده) تعبیه های چند وجهی (منتشر شده) معماری کاربردی RAG چند وجهی (منتشر شده) پردازش ویدیوها برای RAG چندوجهی (منتشر شده) بازیابی چند وجهی از فروشگاه های برداری (منتشر شده) مدل های زبان بزرگ (VLL) (منتشر شده) RAG چند وجهی با LangChain چند وجهی (شما اینجا هستید!) همه چیز را در کنار هم قرار دهید! ساخت اپلیکیشن RAG چندوجهی (به زودی!)

می توانید کدها را پیدا کنید و مجموعه داده ها در این سری در این مخزن GitHub استفاده شده است

راه اندازی محیط کاری فراخوانی سیستم چند وجهی RAG با QueryMultimodal RAG سیستم نمایش تصویر/قاب بازیابی شده

بیشتر بینش‌هایی که در Medium به اشتراک می‌گذارم… وبلاگ کامل را به صورت رایگان در Medium بخوانید.

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/machine-learning/building-multimodal-rag-application-7-multimodal-rag-with-multimodal-langchain