چگونه Drefrag عملکرد RAG 30 × سریعتر در تولید را ارائه می دهد


چگونه Drefrag عملکرد RAG 30 × سریعتر در تولید را ارائه می دهد

آخرین به روز شده در 12 سپتامبر 2025 توسط تیم تحریریه

نویسنده (ها): مروارید

در ابتدا منتشر شده در به سمت هوش مصنوعیبشر

فشرده سازی زمینه هوشمند ، تأخیر و هزینه های زیرساختی را برای تیم های توسعه کاهش می دهد

اگر تا به حال یک سیستم نسل بازیابی با اوج ایجاد کرده اید ، این درد را می دانید. chatbot شما 20 سند مربوطه را می کشد ، آنها را به شما تغذیه می کند LLM، و سپس … شما صبر می کنید. و صبر کن کاربران شما ناامید می شوند. زیرساخت های شما هزینه پرشور است.

چگونه Drefrag عملکرد RAG 30 × سریعتر در تولید را ارائه می دهد

تصویر تولید شده توسط نویسنده با استفاده از AI

در این مقاله در مورد معرفی DEFRAG ، یک تکنیک جدید که توسط محققان متا تهیه شده است ، مورد بحث قرار می گیرد که عملکرد سیستم های نسل بازیابی (RAG) را به میزان قابل توجهی افزایش می دهد. این امر به ناکارآمدی اصلی در فرآیندهای خاردار سنتی ، مانند نفخ توکن و نادیده گرفتن هوش بازیابی ، می پردازد و به زمان پاسخ آهسته کمک می کند. DECRAG یک روش فشرده سازی جدید را اجرا می کند که ضمن کاهش زمان استفاده از حافظه و پردازش ، زمینه لازم را حفظ می کند ، به بیش از 30 برابر سریعتر پاسخ و حفظ دقت می رسد. این مقاله کاربرد عملی آن در محیط های تولید را برجسته می کند ، با تأکید بر مقرون به صرفه بودن و بهبود تجربه کاربر.

وبلاگ کامل را به صورت رایگان در رسانه بخوانیدبشر

منتشر شده از طریق به سمت هوش مصنوعی


درس 90+ ما را از مبتدی به Advanced LLM Developer Certication: از انتخاب یک پروژه گرفته تا استقرار یک محصول کار کنید جامع ترین و کاربردی ترین دوره LLM در آنجا!

به سمت هوش مصنوعی منتشر کرده است ساختمان LLM برای تولید– راهنمای صفحه 470+ ما برای تسلط بر LLM ها با پروژه های عملی و بینش های متخصص!


حرفه ای رویایی خود را به سمت مشاغل هوش مصنوعی کشف کنید

به سمت AI یک هیئت شغلی ساخته شده است که به طور خاص برای یادگیری ماشین و شغل ها و مهارت های علوم داده ها متناسب است. نرم افزار ما در هر ساعت مشاغل زنده AI را جستجو می کند ، برچسب ها و طبقه بندی آنها را می کند و آنها را به راحتی جستجو می کند. امروز بیش از 40،000 شغل زنده را به سمت مشاغل هوش مصنوعی کاوش کنید!

توجه: محتوا شامل نظرات نویسندگان مشارکت کننده است و نه به سمت هوش مصنوعی.




منبع: https://towardsai.net/p/machine-learning/how-refrag-delivers-30x-faster-rag-performance-in-production