در این مقاله، الگوهای مهندسی سریع عملی را خواهید آموخت که مدل های زبان بزرگ را برای تحلیل و پیش بینی سری های زمانی مفید و قابل اعتماد می کند.
موضوعاتی که به آنها خواهیم پرداخت عبارتند از:
- نحوه قاب بندی زمینه زمانی و استخراج سیگنال های مفید
- چگونه استدلال LLM را با مدل های آماری کلاسیک ترکیب کنیم
- نحوه ساختار دهی داده ها و درخواست ها برای پیش بینی، ناهنجاری ها و محدودیت های دامنه
بدون تاخیر بیشتر، بیایید شروع کنیم.
مهندسی سریع برای تجزیه و تحلیل سری های زمانی
تصویر توسط ویرایشگر
مقدمه
هر چقدر هم که عجیب به نظر برسد، مدل های زبان بزرگ (LLM) را می توان برای وظایف تجزیه و تحلیل داده ها، از جمله سناریوهای خاص مانند تجزیه و تحلیل سری های زمانی، مورد استفاده قرار داد. نکته کلیدی این است که مهارت های مهندسی سریع خود را به درستی به سناریوی تجزیه و تحلیل خاص ترجمه کنید.
این مقاله به هفت مورد اشاره می کند استراتژی های مهندسی سریع که می توان از آن برای اهرم استفاده کرد تجزیه و تحلیل سری های زمانی وظایف با LLM ها
جز در مواردی که خلاف آن گفته شود، توصیف این استراتژیها با مثالهای گویا همراه است که حول سناریوی دادههای خردهفروشی میچرخد، به طور مشخص، با در نظر گرفتن مجموعه دادههای سری زمانی متشکل از فروش روزانه در طول زمان برای تجزیه و تحلیل آن.
1. زمینه سازی ساختار زمانی
اول، یک دستور موثر برای به دست آوردن یک خروجی مدل مفید باید به آن کمک کند تا ساختار زمانی مجموعه داده سری زمانی را درک کند. این شامل ذکر احتمالی روندهای صعودی/نزولی، فصلی، چرخه های شناخته شده مانند تبلیغات یا تعطیلات و غیره است. این اطلاعات زمینه به LLM شما کمک می کند، به عنوان مثال، نوسانات زمانی را تفسیر کند – خوب، فقط همین: نوسانات، به جای نویز. در مجموع، توصیف ساختار مجموعه داده به وضوح در زمینه همراه با درخواستهای شما اغلب فراتر از دستورالعملهای استدلالی پیچیده در دستورات است.
اعلان مثال:
در اینجا فروش روزانه (بر حسب واحد) برای 365 روز گذشته است. داده ها فصلی بودن هفتگی (فروش بیشتر در تعطیلات آخر هفته)، روند بلندمدت تدریجی افزایشی و افزایش ماهانه در پایان هر ماه به دلیل تبلیغات روز پرداخت را نشان می دهد.. هنگام پیش بینی 30 روز آینده از این دانش استفاده کنید.
2. استخراج ویژگی و سیگنال
به جای اینکه از مدل خود بخواهید پیش بینی های مستقیم را از روی اعداد خام انجام دهد، چرا از آن نمی خواهید ابتدا برخی از ویژگی های کلیدی را استخراج کند؟ این می تواند شامل الگوهای نهفته، ناهنجاری ها و همبستگی ها باشد. درخواست از LLM برای استخراج ویژگی ها و سیگنال ها و گنجاندن آنها در اعلان (مثلاً از طریق آمار خلاصه یا تجزیه) به آشکار شدن دلایل پشت پیش بینی ها یا نوسانات آینده کمک می کند.
اعلان مثال:
از 365 روز گذشته دادههای فروش، میانگین فروش روزانه، انحراف استاندارد را محاسبه کنید، روزهایی را شناسایی کنید که فروش بیش از میانگین به اضافه دو برابر انحراف استاندارد باشد (یعنی انحرافات بالقوه)، و هر الگوی هفتگی یا ماهانه تکرار شونده را یادداشت کنید. سپس عواملی را تفسیر کنید که ممکن است روزهای یا افت فروش بالا را توضیح دهد، و هرگونه ناهنجاری غیرعادی را علامتگذاری کنید.
3. ترکیبی LLM + گردش کار آماری
بیایید با آن روبرو شویم: LLM ها در انزوا اغلب با وظایفی که نیاز به دقت عددی و گرفتن وابستگی های زمانی در سری های زمانی دارند، دست و پنجه نرم می کنند. به همین دلیل، ترکیب ساده استفاده از آن ها با مدل های آماری کلاسیک فرمولی برای به دست آوردن نتایج بهتر است. چگونه می توان یک گردش کار ترکیبی مانند این را تعریف کرد؟ ترفند این است که استدلال LLM – تفسیر سطح بالا، فرمولبندی فرضیه و درک زمینه – در کنار مدلهای کمی مانند ARIMA، ETS یا موارد دیگر تزریق شود.
به عنوان مثال، LeMoLE (LLM-Enhanced ترکیبی از کارشناسان خطی) نمونه ای از یک رویکرد ترکیبی است که مدل های خطی را با ویژگی های مشتق شده سریع غنی می کند.
نتیجه، استدلال زمینهای و دقت آماری را در هم میآمیزد: بهترین دو جهان.
4. نمایش داده مبتنی بر طرحواره
در حالی که مجموعه دادههای سری زمانی خام معمولاً فرمتهای نامناسبی برای ارسال به عنوان ورودی LLM هستند، استفاده از طرحوارههای ساختاریافته مانند JSON یا جداول فشرده میتواند کلیدی باشد که به LLM اجازه میدهد تا این دادهها را بسیار قابل اعتمادتر تفسیر کند، همانطور که در چندین مطالعه نشان داده شده است.
نمونه ای از قطعه JSON که باید در کنار یک فرمان ارسال شود:
{“فروش”: [
{“date”: “2024-12-01”, “units”: 120},
{“date”: “2024-12-02”, “units”: 135},
…,
{“date”: “2025-11-30”, “units”: 210}
]”فراداده”: { “فرکانس”: “روزانه”، “فصلی”: [“weekly”, “monthly_end”]”domain”: “retail_sales” } }
|
{ “فروش”: [ {“date”: “2024-12-01”, “units”: 120}, {“date”: “2024-12-02”, “units”: 135}, ..., {“date”: “2025-11-30”, “units”: 210} ]، “فراداده”: { “فرکانس”: “روزانه”، “فصلی بودن”: [“weekly”, “monthly_end”]، “دامنه”: “خرده_فروشی” } } |
درخواست همراه کردن دادههای JSON با:
با توجه به دادهها و ابردادههای JSON فوق، سری زمانی را تجزیه و تحلیل کنید و فروش 30 روز آینده را پیشبینی کنید.
5. الگوهای پیش بینی شده
طراحی و ساختاربندی مناسب الگوهای پیشبینی در اعلانات – مانند افقهای کوتاهمدت در مقابل بلندمدت یا شبیهسازی سناریوهای خاص «چه میشود» – میتواند به هدایت مدل برای تولید پاسخهای قابل استفادهتر کمک کند. این رویکرد برای ایجاد بینش بسیار عملی برای تجزیه و تحلیل درخواستی شما موثر است.
مثال:
وظیفه A – کوتاه مدت (7 روز آینده): فروش مورد انتظار را پیش بینی کنید. وظیفه B — بلند مدت (30 روز آینده): یک پیش بینی پایه به اضافه دو سناریو ارائه دهید: – سناریو 1 (شرایط عادی) – سناریو 2 (با ارتقای برنامه ریزی شده در روزهای 10-15) علاوه بر این، یک فاصله اطمینان 95٪ برای هر دو سناریو ارائه دهید.
|
وظیفه الف – کوتاه–مدت (بعدی 7 روز): پیش بینی انتظار می رود فروش. وظیفه ب – طولانی–مدت (بعدی 30 روز): فراهم کند الف خط پایه پیش بینی به علاوه دو سناریوها: – سناریو 1 (عادی شرایط) – سناریو 2 (با الف برنامه ریزی شده است ارتقاء در روز 10–15)
در علاوه بر این، فراهم کند الف 95% اعتماد به نفس فاصله برای هر دو سناریوها. |
6. درخواست های تشخیص ناهنجاری
این یکی بیشتر مربوط به کار است و بر ایجاد درست دستورهایی تمرکز دارد که ممکن است نه تنها به پیش بینی با LLM ها کمک کند، بلکه به تشخیص ناهنجاری ها – در ترکیب با روش های آماری – و دلایل احتمالی آنها کمک کند، یا حتی پیشنهاد کند که چه چیزی باید بررسی شود. نکته کلیدی این است که یک بار دیگر ابتدا با ابزارهای سری زمانی سنتی پیش پردازش شود و سپس مدل را برای تفسیر یافته ها وادار کنید.
اعلان مثال:
“با استفاده از دادههای فروش JSON، ابتدا هر روزی را که فروش بیش از 2 برابر انحراف استاندارد هفتگی از میانگین هفتگی انحراف دارد، پرچمگذاری کنید. سپس برای هر روز پرچمگذاری شده، دلایل احتمالی را توضیح دهید (مثلاً، عدم موجودی، تبلیغات، رویدادهای خارجی) و توصیه کنید که آیا بررسی شود (مثلاً بررسی سیاهههای موجودی، کمپین بازاریابی، ترافیک پای فروشگاه).
7. استدلال مبتنی بر دامنه
دانش دامنه مانند الگوهای فصلی خردهفروشی، اثرات تعطیلات، و غیره، بینشهای ارزشمندی را آشکار میکند، و جاسازی آن در اعلانها به LLMها کمک میکند تحلیلها و پیشبینیهایی را انجام دهند که معنادارتر و همچنین قابل تفسیر هستند. این به استفاده از ارتباط “زمینه مجموعه داده”، هم از نظر معنایی و هم از نظر دامنه خاص، به عنوان فانوس دریایی که استدلال مدل را هدایت می کند، خلاصه می شود.
درخواستی مانند این می تواند به LLM کمک کند تا در پیش بینی جهش های آخر ماه یا کاهش فروش به دلیل تخفیف های تعطیلات بهتر عمل کند:
“این دادههای فروش روزانه یک زنجیره خردهفروشی است. فروش در پایان هر ماه افزایش مییابد (مشتریان حقوق دریافت میکنند)، در تعطیلات رسمی کاهش مییابد، و در رویدادهای تبلیغاتی افزایش مییابد. همچنین گهگاه کمبود سهام وجود دارد که منجر به افت برای SKUهای خاص میشود. از این دانش دامنه هنگام تجزیه و تحلیل سری و پیشبینی استفاده کنید.
بسته بندی
این مقاله هفت استراتژی مختلف را شرح میدهد که عمدتاً توسط مطالعات اخیر پایهگذاری و پشتیبانی میشوند تا اعلانهای مؤثرتری برای تجزیه و تحلیل سریهای زمانی و وظایف پیشبینی با کمک LLMها ایجاد کنند.