نویسنده (ها): کووشیک هولا
در ابتدا منتشر شده در به سمت هوش مصنوعیبشر
از زمان شروع ادغام بیش از دو سال گذشته است LLMS برای دستیابی به محصولات KPI و اهداف ، به برنامه های تجاری وارد برنامه های تجاری می شود – و این یک سوار وحشی بوده است. در طی این سالها ، من در شرایطی بوده ام که تقریباً هر تکنیک سریع را در آنجا امتحان کرده ام مانند صفر ، چند ضربه ، نقش ، نقش مبتنی بر نقش ، گام به گام و غیره. بعضی اوقات خروجی نزدیک بود ، اما کاملاً مفید نبود. بعضی اوقات این نکته را کاملاً از دست داد.
بعد از اینکه دوباره و دوباره به دیوارها ضربه زد ، سرانجام کلیک کرد: وادار کردن فقط به “صحبت با هوش مصنوعی” بهتر نیست – این یک مهارت استبشر دادن سریع سریع تفاوت بین حدس و گمان و یک گردش کار قابل اعتماد است. این می تواند با افزایش شرکت هایی که کل محصولات را در اطراف اعلان های کارآمد و کارآمد ساخته اند ، تأیید شود. در بسیاری از موارد ، آنها اساساً در اطراف هستند LLMS این کار بسیار خوب است زیرا سوابق پشت صحنه تیز ، ساختار یافته و قابل تکرار است.
چرا ما به این چارچوب احتیاج داریم؟
اکنون که LLM ها به بخشی از گردش کار روزانه ما تبدیل شده اند ، خواه از طریق چتپ ، نشانگر ، سرگیجه یا ده ها ابزار دیگر-ما نمی توانیم به تکیه گاه های عمومی ، ضربه یا از دست رفته اعتماد کنیم. من ماهها در تکرار ، آزمایش و پالایش رویکرد خودم گذرانده ام ، و از تمام آن آزمایش و خطای اضافه کاری به چیزی رسیدم که اکنون آن را صدا می کنم چرا-چارچوب ایالات متحدهبشر این عالی نیست ، اما به طور مداوم به من می دهد نتایج بهتر در مقایسه با فقط بال زدن.
در چارچوب W – y – y – یک ساختار قابل تکرار ، فقط چهار بلوک است – برای تبدیل هرگونه درخواست فازی به یک کتاب پخش قابل استفاده مجدد که یک AI می تواند هر بار از آن پیروی کند.
بیایید به هر بلوک از چارچوب شیرجه بزنیم و درک کنیم که چگونه از آن استفاده کنید. من در مورد هر بلوک و نحوه استفاده از آن با استفاده از بررسی محصول آمازون صحبت خواهم کرد مجموعه داده به عنوان مثال
بررسی محصولات آمازون مجموعه داده از Kaggle ، که حاوی بیش از آن است 500000 بررسی مشتری در طیف گسترده ای از محصولات. هر ورودی شامل زمینه های کلیدی مانند است product_id
با review_text
با rating
وت timestamp
، ارائه یک منبع غنی برای تجزیه و تحلیل احساسات، تشخیص روند و بینش بازخورد محصول.
چارچوب:
W – واقعیت ها/حقیقت چیست؟
سوال راهنمایی: این بلوک پایه و اساس را تنظیم می کند.“چه حقایقی یا محدودیت ها هرگز تغییر نمی کنند؟” این حقایق غیرقابل تغییر را در مورد کار ایجاد می کند.
برای مجموعه داده ما:
ساختار مجموعه داده ها: هر ورودی شامل می شود
product_id
باreview_text
باrating
وتtimestamp
بشرمقیاس رتبه بندی: رتبه بندی ها از 1 تا 5 ستاره است.
زبان: همه بررسی ها به زبان انگلیسی است.
نقشه برداری احساسات: برای اهداف تجزیه و تحلیل ، رتبه بندی ها به صورت طبقه بندی می شوند:
1. مثبت: 4-5 ستاره
2. خنثی: 3 ستاره
3. منفی: 1-2 ستاره
این ثابت ها پایه و اساس هرگونه تجزیه و تحلیل یا مدل سازی را تعیین می کنند. اینها غیر مذاکره هستند-نوع کارهایی که هوش مصنوعی باید در صورت انجام این کار بداند و به آنها احترام بگذارد کار درست
ح – چگونه آن را انجام دهیم
سوال راهنمایی: “دنباله دقیق مراحل چیست؟” یعنی ما روش گام به گام را تعریف می کنیم.
تمیز کردن داده ها:
ورودی های تهی یا کپی را حذف کنید.
متن را با تبدیل به حروف کوچک و از بین بردن شخصیت های خاص ، عادی کنید.
تجزیه و تحلیل احساسات: برای طبقه بندی یک مدل تجزیه و تحلیل احساسات از پیش آموزش داده شده استفاده کنید
review_text
به دسته های مثبت ، خنثی یا منفی.تجمع:
بررسی های گروهی توسط
product_id
بشرمحاسبه: میانگین رتبه بندی در هر محصول و تعداد بررسی ها در هر دسته از احساسات.
تجسم:
نمودارهای نوار را نشان می دهد که توزیع احساسات در هر محصول را نشان می دهد.
ابرهای کلمه ای را برای شایع ترین اصطلاحات در بررسی های مثبت و منفی ایجاد کنید.
گزارش: یافته ها را در یک گزارش علامت گذاری برای ذینفعان تهیه کنید.
این رویکرد ساخت یافته ، سازگاری و تکرارپذیری را تضمین می کند.
y – چرا مهم است
سوال راهنمایی: “چه معیارهای موفقیت ، اهداف یا راهنمایی های ذهنیت را انتخاب می کند؟” اساساً درک هدف پشت کار:
هدف تجاری: روند رضایت مشتری را برای اطلاع رسانی در مورد بهبود محصول و استراتژی های بازاریابی شناسایی کنید.
معیارهای با کیفیت:
دقت طبقه بندی احساسات.
وضوح و خوانایی تجسم.
نیازهای ذینفعان: بینش ها باید توسط اعضای تیم غیر فنی عملی و به راحتی قابل تفسیر باشند.
در نظر گرفتن این اهداف تضمین می کند که تجزیه و تحلیل ارزش را ارائه می دهد.
U – ما با هم (هنگام کار با نمایندگان)
سوال راهنمایی: “چگونه مأمورین دست به دست می شوند یا همکاری می کنند؟” یعنی تعریف نقش ها و نقاط همکاری:
#DataEngineer: مجموعه داده ها را آماده و تمیز می کند.
#DataAnalyst: تجزیه و تحلیل احساسات را انجام می دهد و تجسم ایجاد می کند.
#marketingteam: این گزارش را برای به دست آوردن بینش های عملی بررسی می کند.
ابزارهای همکاری:
برای برقراری ارتباط از Slack استفاده کنید.
گزارش های فروشگاه را در یک پوشه مشترک Google Drive.
جلسات دو هفته ای را برای بحث در مورد یافته ها برنامه ریزی کنید.
روشن کردن مسئولیت ها همکاری صاف را تسهیل می کند.
همه آنها را کنار هم قرار دهید:
یک مثال سریع با استفاده از چراو
I'm analyzing the [Amazon Product Reviews Dataset](https://www.kaggle.com/datasets/arhamrumi/amazon-product-reviews) to extract customer sentiment insights.**W — What’s True:**
- Dataset includes `product_id`, `review_text`, `rating`, and `timestamp`.
- Ratings range from 1 to 5 stars.
- Reviews are in English.
**H — How to Do It:**
- Clean the data by removing nulls and duplicates.
- Normalize `review_text`.
- Classify sentiments using a pre-trained model.
- Aggregate data by `product_id` to compute average ratings and sentiment counts.
- Visualize results with bar charts and word clouds.
- Compile findings into a Markdown report.
**Y — Why It Matters:**
- Aim to uncover customer satisfaction trends.
- Provide actionable insights for product and marketing teams.
- Ensure clarity and accuracy in reporting.
**U — Us Together:**
- #DataEngineer handles data preparation.
- #DataAnalyst conducts analysis and visualization.
- #MarketingTeam reviews and acts on insights.
- Utilize Slack and Google Drive for collaboration.
توجه: اگر چندین نقش درگیر است ، هشتگ سریع اضافه کنید – #DataEngineer
با #DataAnalyst
با #MarketingTeam
– در جلوی یک گلوله. اگر انفرادی هستید ، از برچسب ها پرش کنید.
هنگام پر کردن چارچوب ، به یاد داشته باشید ،
- گلوله های مغز مغز در زیر هر عنوان ، نگران متن کامل نباشید.
- فقط نکاتی را حفظ کنید که باید بودن برای نتایج مداوم درست است.
- چهار بلوک را از بالا – تاتوم بخوانید. یک غریبه باید کار را درک کند.
- به عنوان اولین سریع خود (یا “سیستم” سریع خود در چتگپ ، مکان نما ، لانگچین و غیره بچسبانید.
- اگر مدل می لغزد ، گلوله ای را که مبهم بود محکم کنید.
این سریع ساختار یافته خروجی های سازگار و با ارزش را نسبت به یک طرفه خاموش ارائه می دهد.
مشکلات مشترک:
حتی با وجود یک چارچوب ساده مانند W – H – y – ، گیربکس آسان است. من خودم همه این اشتباهات را مرتکب شده ام – بنابراین در اینجا رایج ترین آنها وجود دارد ، و چگونه می توان از آنها جلوگیری کرد:
پر کردن همه چیز در “چه”
این وسوسه انگیز است که تمام دستورالعمل ها و زمینه های خود را در بلوک “آنچه درست است” قرار دهید. اما اگر در مورد مراحل یا اقدامات باشد ، متعلق به آن است “چگونه.” اگر این شامل همکاری است یا چه کسی کاری را انجام می دهد ، آن را به سمت آن منتقل کنید “ما.”
مبهم بودن در “چرا”
“این مهم است” عمومی به تصمیم گیری در مورد راهنمایی کمک نمی کند. در عوض ، معیارهای موفقیت آمیز را مانند:
- “زمان پاسخ باید زیر 3 ثانیه باشد.”
- “خلاصه باید حداقل 80 ٪ در بررسی های دقت کسب کند.”
- “هدف در تمام ماژول ها 99 ٪ به موقع است.”
استفاده از برچسب های بیش از حد
فقط از برچسب هایی استفاده کنید #Reviewer
یا #Engineer
وقتی یک گلوله بها تغییرات بر اساس چه کسی این کار را انجام می دهد. در غیر این صورت ، برچسب ها را پرش کنید – آنها بیش از وضوح به هم ریخته می شوند.
غذای نهایی
در چارچوب W – y – y – به شما کمک می کند تا هر کار ، بزرگ یا کوچک را به چهار بلوک ساختمانی قابل تکرار و قابل تکرار تقسیم کنید:
چه چیزی درست است
چگونه آن را انجام دهیم
چرا مهم است
ما با هم
این که آیا شما آن را به یک هوش مصنوعی واگذار می کنید یا با یک هم تیمی همکاری می کنید ، این چارچوب روشی ساختاری و قابل استفاده مجدد برای تبدیل درخواست های فازی به کتابهای پخش قابل اعتماد و قابل اعتماد به شما می دهد. یک بار بنویسید ، برای همیشه استفاده کنید – و تکیه بر “جادو” سریع را متوقف کنید.
پیوندها:
بررسی محصولات آمازون
568K + بررسی مصرف کننده در محصولات مختلف آمازون
www.kaggle.com
منتشر شده از طریق به سمت هوش مصنوعی