بهبود کیفیت صفر با تزریق فعل


نویسنده (ها): میخائیل سیمین

در ابتدا منتشر شده در به سمت هوش مصنوعیبشر

آموزش مدل های زبان آموزش افعال پیچیده جدید

تنظیم دقیق مدل های بزرگ زبان (LLMS) به روش پیش فرض برای خیاطی سیستم های هوش مصنوعی به کارهای خاص تبدیل شده است ، اما اغلب با اشکالاتی قابل توجهی همراه است: هزینه های محاسباتی بالا ، شکنندگی از بیش از حد ، فراموشی فاجعه بار و موانع آماده سازی داده های قابل توجه. این چالش ها قابلیت استفاده عملی از تنظیم دقیق سنتی را محدود می کند ، به ویژه برای تیم هایی که به دنبال راه حل های کارآمد و سازگار هستند. برای پرداختن به این شکاف ، من یک روش جایگزین به نام “تزریق فعل” را مورد بررسی قرار داده ام ، که به شما این امکان را می دهد تا LLM ها را کاملاً جدید و پیچیده با نمونه های حداقل آموزش دهید و در نتیجه عملکرد قدرتمند صفر و بدون سردردهای معمولی تنظیم می شود.

به هر حال ، Azure بیش از سه ده مدل LLM را به راحتی از طریق زمین بازی یا بازار Github خود در دسترس قرار می دهد.

من زمان زیادی را صرف کاوش در روش های مختلف برای خم کردن یک مدل به خواست خود کرده ام ، و متوجه چیز جالبی شده ام: در حالی که این مدل ها بسیار متنوع هستند ، بحث زیادی در مورد آموزش آنها به کلمات کاملاً جدید ، به ویژه افعال با رفتارهای خاص و پیچیده وجود ندارد. هدف اصلی که من ارائه کردم پاسخ دادن به این سؤال است ، “چگونه می توانم از نشانه های کمتری برای دستورالعمل در مورد دستکاری داده های پیچیده استفاده کنم؟” بنابراین در اینجا می خواهم مفهوم “تزریق فعل” را به اشتراک بگذارم: روشی برای آموزش یک مدل یک کلمه انگلیسی جدید که یک فعل پیچیده است – فقط با استفاده از یک… وبلاگ کامل را به صورت رایگان در رسانه بخوانیدبشر

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/machine-learning/improving-zero-shot-quality-with-verb-injection