تنظیم دقیق Deepseek R1 در مورد استدلال با Unloth [Part 2]

نویسنده (ها): یوسف حسنی

در ابتدا منتشر شده در به سمت هوش مصنوعیبشر

Deepseek تنظیم دقیق در مورد استدلال پزشکی مجموعه داده

این داستان فقط عضو بر ما است. برای دسترسی به همه رسانه ها ارتقا دهید.

شرکت Deepseek اخیراً Deepseek-R1 را منتشر کرد ، گام بعدی در کار خود در مورد مدل های استدلال. این یک به روزرسانی از Deepseek-R1-Lite-Preview قبلی آنها است و نشان می دهد که آنها در مورد رقابت با O1 Openai جدی هستند.

در این آموزش دو بخشی دستی ، ما مدل Deepseek-R1-Distill-Llama-8B را روی زنجیره پزشکی فکر می کنیم مجموعه داده از بغل کردن صورت با استفاده از UNLOTH.

در بخش اول این مقاله ، ما مقدمه ای از مدل Deepseek R1 را پوشش دادیم و سپس محیط کار را تنظیم کردیم ، مدل و توکینیزر را بارگیری کردیم و سرانجام مدل را با استنتاج صفر آزمایش کردیم و نتیجه را بدون ریزش مشاهده کردیم تنظیم

در این بخش ، ما با بارگیری و پردازش مجموعه داده های استدلال پزشکی که برای تنظیم دقیق مدل استفاده خواهیم کرد ، شروع خواهیم کرد. پس از آماده شدن داده ها ، ما مدل را به خوبی تنظیم می کنیم و در آخر ، مدل تنظیم شده خوب را آزمایش می کنیم و آن را به صورت محلی و در آغوش چهره ذخیره می کنیم.

منبع: https://towardsai.net/p/l/fine-tuning-deepseek-r1-on-reasoning-task-with-unsloth-part-2