درس 6 زنده است: تنظیم دقیق ، لورا ، RLHF و ابزارهایی که به شما کنترل واقعی می دهند

نویسنده (ها): به سمت تیم تحریریه AI

در ابتدا منتشر شده در به سمت هوش مصنوعیبشر

اگر دو آموزش اول را در آغازگر 10 ساعته LLM، شما در حال حاضر می دانید که چه فرکانس می تواند انجام دهد ، و دیده اید که چگونه بازیابی آن را یک قدم جلوتر می برد.

اما اگر تا به حال با لحن ، دقت دامنه یا توهم سرسخت به دیوار برخورد کرده اید ، از قبل حقیقت را می دانید:

بعضی اوقات ، یک فوریت هوشمندانه (زمینه) کافی نیست. گاهی اوقات ، شما باید مدل را دوباره تهیه کنیدبشر

درس 6: مدل های آموزش مجدد اکنون در دوره آغازگر 10 ساعته LLM زندگی می کنند

این چیزی است که شما یاد خواهید گرفت:

✅ چگونه می توان مدل های باز را فقط با چند صد نمونه تنظیم کرد

✅ چه موقع از SFT ، LORA ، QLORA و نحوه جلوگیری از هدر رفتن محاسبات استفاده کنید

✅ مقدمه ای سریع برای یادگیری تقویت با PPO ، DPO ، GRPO ، RLHF و RLAIF

✅ چگونه می توان از حالت های شکست مشترک جلوگیری کرد: بیش از حد ، کمبود ، توهمات

✅ پیاده روی کامل آموزش با ناخوشایند ، حتی در GPU های رایگان

این فقط “نحوه تنظیم دقیق” نیست.

این نحوه تصمیم گیری است کی برای تنظیم دقیق ، چگونه برای انجام کارآمد آن ، و چگونه برای دانستن اینکه آیا کار کرده است یا خیر.

برای باز کردن قفل درس 6 اکنون ارتقا دهید و فراتر از پیش نمایش رایگان

دسترسی کامل داشته باشید!

چه چیز دیگری را با دسترسی کامل باز می کنید؟

ارزیابی آنچه در واقع مهم است، و معیارهای خودکار (Bleu ، Rouge ، Emplexity) را با حلقه انسان و ترکیب کنید LLMدر مورد بررسی های قاضی و موارد آزمون آگاهانه دامنه.
جریان کار عامل و استفاده از ابزار را جدا کنید، درک کنید که چه زمانی ارکستراسیون چند مرحله ای ضروری است ، چگونه ابزارها از طریق تماس های API یا افزونه ها ادغام می شوند و چگونه می توان هزینه ها و تأخیر را تحت کنترل خود نگه دارید.
اصول اصلی بهینه سازی و اصول ایمنی، از جمله تقطیر مدل ، کمیت و کاهش سریع تزریق ، بنابراین سیستم های شما سبک ، ایمن و آماده تولید هستند.

قبل از اینکه متخصص شوید ، به کسی تبدیل شوید که می داند ابتدا چه چیزی را امتحان کنید.

اکنون ثبت نام کنید و شیرجه عمیق 2 ساعته ما را روشن کنید LLM ارزیابی شامل (همانطور که ما این درس نهایی را اضافه می کنیم ، قیمت بالا می رود. آخرین فرصت شما برای دریافت آن با 199 دلار است!)

در مورد آغازگر 10 ساعته

این دوره در ابتدا به عنوان یک بوت کامپ 1 روزه برای متخصصان نرم افزار (زبان آگنوستیک) طراحی شده است. اگرچه این دوره تمرکز “برای توسعه دهندگان” دارد ، اما برای همه مرتبط است!

دانش قبلی لازم نیست.

بنیادی در پایتون کمک می کند ، اما برای بهره مندی از آموزش ضروری نیست.

ما مهارت ها و تکنیک های اصلی LLM را به همراه نکات عملی آموزش می دهیم. با این کار شما را در استفاده از LLMS از طریق زبان طبیعی یا مستندات مربوط به سیستم عامل ها و چارچوب های مدل LLM را در زبان برنامه نویسی مورد نظر خود کاوش کنید و شروع به توسعه پروژه های LLM سفارشی خود کنید.

این دوره به طرز چشمگیری سیل اطلاعاتی در مورد LLM ها را کاهش می دهد و دانش را در ماژول های قابل هضم و با اندازه نیش پذیر ارائه می دهد که گام به گام اعتماد به نفس را ایجاد می کنند. بخش های مربوط به مهندسی سریع و ادغام API بسیار ارزشمند بودند ، و مهارتهای عملی را که بلافاصله برای ایجاد معلمان هوش مصنوعی سفارشی برای پروژه های یادگیری خودم استفاده کردم ، ارائه می دهند. – مت شانتری

به علاوه ، شما همچنین دریافت می کنید:

📼 سخنرانی های ویدیویی خود گام به گام: همه جلسات از قبل ضبط شده اند ، بنابراین می توانید در برنامه خود بیاموزید.
🔁 دسترسی به طول عمر: شامل تمام به روزرسانی های آینده است.
🧑‍🏫 تماس تلفنی زنده + Discord Private: سؤال کنید ، بازخورد بگیرید و با مربیان ارتباط برقرار کنید. (تماس بعدی این یکشنبه است اگر به اندازه کافی سریع وارد شوید!)
📜 گواهی تکمیل: مهارت های خود را در LinkedIn یا رزومه خود به نمایش بگذارید.
💵 100 ٪ ضمانت برگشت پول ظرف 30 روز: اگر به شما کمک نمی کند با LLMS بهتر بسازید ، بازپرداخت کامل دریافت کنید.

شما قبلاً وقت خود را سرمایه گذاری کرده اید.

اکنون روی مهارتهایی که به شما در حمل و نقل باهوش تر و سریعتر کمک می کند ، سرمایه گذاری کنید.

درس 6 را در حال حاضر در داخل آغازگر 10 ساعته LLM تماشا کنید

منتشر شده از طریق به سمت هوش مصنوعی

منبع: https://towardsai.net/p/artificial-intelligence/lesson-6-is-live-fine-tuning-lora-rlhf-the-tools-that-give-you-real-control