اگر تا به حال از ChatGPT یا هر مدل زبان بزرگ دیگری (LLM) استفاده کرده اید و فکر کرده اید که چه چیزی به آنها کمک می کند تا به روشی که انجام می دهند کار کنند، این مقاله برای شماست.
فرمان چند شات، یک شات و صفر شات سه استراتژی متفاوتی هستند که در مهندسی سریع برای راهنمایی مدلهای زبان بزرگ برای انجام کارشان به خوبی استفاده میشوند. این مقاله این سه استراتژی را با مثال های عملی از نحوه کار آنها مورد بحث قرار می دهد.
خوانندگان همچنین یاد خواهند گرفت که از چه نوع تحریکی در یک موقعیت خاص استفاده کنند و تفاوت بین هر دو روش.
با این حال، اول، مهندسی سریع چیست؟
مهندسی سریع چیست؟
مهندسی سریع یک روش مهندسی هوش مصنوعی است که شامل ایجاد، ساختاردهی و آزمایش دستورات است. از سوی دیگر، پرامپتها متون، تصاویر یا کدهایی هستند که با مدلهای زبان بزرگ و ابزارهای هوش مصنوعی قابل درک هستند.
به عبارت ساده تر، مهندسی سریع به هر چیزی که در پشت صحنه ایجاد ابزارهای مبتنی بر LLM رخ می دهد اشاره دارد. در طول فرآیند مهندسی، یک مدل زبان بزرگ طراحی و آموزش داده می شود تا زمانی که کاربر یک متن، کد یا تصویر را وارد می کند، خروجی تولید کند (یعنی پاسخی ارائه دهد). آموزش داده شده است تا بر اساس ورودی ها پیش بینی کند.
این می تواند به دست آید زیرا LLM ها برای درک دانش رایج و معنای کلمات مجهز هستند. آنها همچنین برای پیروی از دستورالعمل های ساده آموزش دیده اند. در نتیجه، زمانی که کاربر یک جمله یا دستورالعمل کامل را وارد می کند، انتظار می رود که مدل خروجی دقیقی ارائه دهد.
مهندسی سریع در هوش مصنوعی اساسی است زیرا به کاربران مولد هوش مصنوعی این امکان را میدهد تا پاسخهای جذابی دریافت کنند. برای دستیابی به این نتیجه، از سه روش مختلف (اعلام چند شات، پرامپت یک شات، و پرامپت صفر شات) برای آموزش مدلهای زبان بزرگ در مورد نحوه تولید خروجی استفاده میشود.
پرامپت صفر شات
پرامپت صفر شات روشی است که در آن استفاده می شود مهندسی سریع برای ایجاد پاسخ بدون ارائه هیچ الگوی برای کار. این مدلهای زبان بزرگ را قادر میسازد تا زمانی که کاربر هیچ زمینه اضافی ارائه نمیکند، پاسخ ایجاد کنند.
دستور صفر شات به یک مدل اجازه می دهد تا بدون آموزش اضافی به اطلاعاتی که قبلاً در حال حرکت در معرض آنها قرار نگرفته است، پاسخی سریع و دقیق ارائه دهد. کل ایده پشت این استراتژی این است که به یک مدل اجازه دهیم تا برای تولید خروجی کاملاً بر آموزش قبلی خود تکیه کند.
نمونه هایی از پرامپت صفر شات
در زیر دو نمونه از ورودیهایی با پرامپت صفر شات و پاسخهای ChatGPT ارائه شده است:
در مثال اول، ورودی ارائه شده این بود:
این جمله را به مثبت، منفی یا خنثی طبقه بندی کنید.
لباس گران است.
پاسخ ChatGPT این بود:
خنثی
در مثال دوم، ورودی ارائه شده این بود:
آسمان آبی است.
پاسخ:
احساس: خنثی
توجه داشته باشید که در هر دو مثال، خروجی تولید شده صحیح بوده است. این به این دلیل است که مدل از قبل برای درک کلمات ساده مانند * لباس، «گران»، «آسمان» و «آبی» آموزش دیده است. همچنین برای اطاعت از دستورالعمل های ساده طراحی شده است. در نتیجه، چت بات برای ارائه پاسخ دقیق به آموزش قبلی خود متکی بود.
یکی از نکات مهمی که باید به آن توجه داشت این است که پرامپت یک شات ممکن است همیشه خروجی قابل اعتمادی تولید نکند. برای مثال، ورودی حاوی اطلاعاتی که درک آن دشوار است ممکن است برای پردازش یک مدل زبان بزرگ بسیار پیچیده باشد. اگر این اتفاق بیفتد، ارائه اطلاعات اضافی به ابزار هوش مصنوعی ضروری است. فرآیند افزودن اطلاعات بیشتر، یک استراتژی است که به عنوان پرامپت یک شات شناخته می شود.
پرامپت تک شات
پرامپت تک شات یک استراتژی است که برای تولید خروجی از ورودی حاوی مقدار محدودی اطلاعات اضافی استفاده می شود. همانطور که از نام “یک شات” پیداست، اطلاعات اضافی ارائه شده می تواند یک نمونه یا فقط یک الگو باشد.
برخلاف صفر شات، پرامپت یک شات اجازه می دهد تا تنها یک مثال یا الگو در داده های ورودی گنجانده شود تا پاسخی از یک ابزار هوش مصنوعی دریافت کند. این مثال یا اطلاعات اضافی ممکن است بی نهایت کوچک به نظر برسد، اما در حصول اطمینان از نتایج دقیق بسیار کمک خواهد کرد.
نمونه ای از پرامپت تک شات
در مثال اول، تحت پرامپت صفر شات، ChatGPT این جمله را فرض کرد “لباس گران است” بی طرف بود
با این حال، برای برخی از کاربران هوش مصنوعی، این جمله ممکن است به این معنی باشد که آنها نمی توانند لباس را بپردازند، یا اینکه از بودجه آنها بیشتر است. در این مورد، جمله برای آنها منفی است و پاسخ چت بات نادرست بود.
افزودن یک مثال به ورودی، ابزار هوش مصنوعی را آموزش میدهد تا مانند کاربرانش «فکر کند» و مطابق با آن پاسخ دهد. تصویری که این موضوع را نشان می دهد در زیر پیوست شده است:
در این مثال، ورودی ارائه شده این بود:
لباس مقرون به صرفه است
احساس: مثبت
لباس گران است
احساس:
پاسخ ارائه شده توسط ChatGPT:
منفی
این مثالهای بالا قدرت پرامپت تکشات را نشان میدهد. چت بات فرض خود را تصحیح کرد و این بار جمله را منفی دید، زیرا ورودی نمونه ای را ارائه می دهد که تفکر کاربر را منعکس می کند. میتوانیم نتیجه را با استفاده از چند شات بیشتر گسترش دهیم.
چند شات تحریک
کاربران هوش مصنوعی زمانی که فقط یک مثال وارد می کنند ممکن است همیشه از پاسخ های مدل های زبان بزرگ راضی نباشند. این به این دلیل است که یک مثال ممکن است تمام جزئیات مهم مورد نیاز برای عملکرد خوب مدل را ارائه ندهد.
سناریوی فوق نیاز به چند شات تحریک. شبیه به پرامپت تک شات، پرامپت چند شات شامل توانمندسازی مدلهای زبان بزرگ برای تولید خروجیهای رضایتبخش بر اساس اطلاعات اضافی کاربران در ورودی است.
به جای یک مثال، کاربران می توانند مدل را با ارائه چندین مثال، معمولاً بین دو تا پنج، راهنمایی کنند. هر چیزی بالاتر از محدوده ممکن است برای چت بات بسیار پیچیده شود.
نمونه هایی از پرامپت چند شات
از همان مثالی که برای نشان دادن استراتژی های قبلی استفاده شد، این بار نیز استفاده شد. اما یک چیز متفاوت بود. به جای چسبیدن به طبقه بندی های مثبت، منفی و خنثی، “تا حدودی مثبت” و “بسیار منفی” اضافه شدند، همانطور که در زیر نشان داده شده است:
همانطور که در بالا مشاهده شد، ورودی کاربر این بود:
لباس سفارشی است
احساس: تا حدودی مثبت
لباس براق است
احساس: خنثی
لباس کاملا آشکار است
احساس: به شدت منفی
بافت لباس کمی بهتر از آن چیزی است که فکر می کردم
احساس:
خروجی ChatGPT:
تا حدودی مثبت
در اینجا، هیچ دستورالعمل خاصی برای گفتن اینکه ChatGPT چه کاری انجام دهد یا چگونه پاسخ دهد، وارد نشده است. در عوض، سه مثال گنجانده شد تا به مدل کمک کند تا نوع پاسخ ارائه شده را تعیین کند. مثالها بهعنوان یک راهنما عمل میکنند، و این روش بهعنوان پرامپت چند شات شناخته میشود.
چگونه بدانیم چه چیزی را انتخاب کنیم
به عنوان یک کاربر، ممکن است گاهی در هنگام استفاده از یک مدل زبان بزرگ، گیج شوید یا انتخاب استراتژی برایتان دشوار باشد. بنابراین چگونه می توانید بدانید که چه چیزی را انتخاب کنید؟ نکات زیر می تواند کمک کننده باشد:
- تفاوت بین سه راهبرد محرک را بشناسید: دانستن تفاوت ها یک گام به سوی انتخاب درست است.
- برای تعیین اینکه مدل به چه مقدار اطلاعات نیاز دارد تا به طور رضایت بخش پاسخ دهد، از تشخیص استفاده کنید. برای کمک به تشخیص سریع، این سوالات را از خود بپرسید:
- آیا اطلاعات ساده است یا پیچیده؟
- اگر پیچیده است، چه مقدار اطلاعات اضافی مورد نیاز است؟ یک، دو یا پنج؟
تفاوت بین پرامپت صفر شات، یک شات و چند شات
اعلان صفر شات، تک شات و چند شات همه راهبردهایی هستند که برای “آموزش” یا آموزش مدل های زبان بزرگ مانند ChatGPT در مورد چگونگی ایجاد نتایج رضایت بخش برای کاربران استفاده می شوند. اگرچه این روشها به یک هدف، یعنی تولید خروجیهای خوب عمل میکنند، باز هم تفاوتهای خاص خود را دارند.
یادگیری این تفاوت ها برای کاربران ضروری است زیرا دانش به آنها کمک می کند تا تصمیمات خوبی در مورد استراتژی و زمان انتخاب کنند. تفاوت ها در زیر توضیح داده شده است:
- تفاوت در تعداد اطلاعات اضافی
پرامپت Zero-shot هیچ اطلاعات اضافی برای ابزارهای هوش مصنوعی ارائه نمی دهد، در حالی که دو مورد دیگر (اعلام یک شات و چند شات) به تعداد متفاوتی از اطلاعات اضافی اجازه می دهند.
پرامپت تک شات تنها یک مثال برای راهنمایی مدل ارائه می دهد تا مانند کاربر «فکر کند» و پاسخ مناسبی ایجاد کند. با این حال، چند شات، مدل را قادر میسازد تا بر اساس چند مثال، معمولاً بین یک تا پنج، که در ورودی ارائه میشود، نتایج ایجاد کند.
- تفاوت در انواع اطلاعاتی که هر کدام می توانند پردازش کنند
مدل های زبان بزرگ برای پردازش اطلاعات ساده و پیروی از دستورالعمل های ساده از قبل آموزش دیده اند. با این حال، کاربران ممکن است نیاز به پاسخی به اطلاعاتی داشته باشند که چندان ساده نیست. در این مورد، پردازش اطلاعات پیچیده بدون مثال های کافی ممکن است آسان نباشد.
به همین دلیل، اثربخشی پرامپت صفر شات محدود است، زیرا فقط می تواند اطلاعات ساده را پردازش کند. از سوی دیگر، پرامپت تک شات می تواند برای برخی از اطلاعات پیچیده پاسخ دهد، اما چند شات کار را بهتر انجام می دهد، زیرا ممکن است یک شات همیشه نتایجی را ارائه نکند که دقیق و نیازهای کاربران را برآورده کند.
نتیجه گیری
این مقاله توضیح داد که چگونه اعلان صفر، چند شات و یک شات، مدلهای زبان بزرگ مانند ChatGPT را قادر میسازد تا خروجیهایی تولید کنند که نیازهای کاربران را برآورده کند. همانطور که از نام آنها پیداست، شات صفر شامل صفر اطلاعات یا مثال اضافی است. یک شات فقط شامل یک قطعه اطلاعات اضافی است، در حالی که چند شات شامل بیش از یک مثال است (بین دو تا پنج مثال).
خوانندگان همچنین نمونههای عملی از نحوه عملکرد این سه روش در ChatGPT و چگونگی انتخاب در یک موقعیت خاص را یاد گرفتند. در نهایت تفاوت های این سه به تفصیل توضیح داده شد.
در حالی که شات صفر فقط روی اطلاعات ساده کار می کند، یک شات و چند شات نتایج دقیق با جزئیات پیچیده بهتر از اولی ایجاد می کنند.
بهرهگیری کامل از این تکنیکهای تحریک به کاربران کمک میکند تا خروجیهای دقیقتر و مناسبتری برای رفع نیازهای خود به دست آورند.