مهندسی سریع برای تجزیه و تحلیل سری های زمانی




در این مقاله، الگوهای مهندسی سریع عملی را خواهید آموخت که مدل های زبان بزرگ را برای تحلیل و پیش بینی سری های زمانی مفید و قابل اعتماد می کند.

موضوعاتی که به آنها خواهیم پرداخت عبارتند از:

  • نحوه قاب بندی زمینه زمانی و استخراج سیگنال های مفید
  • چگونه استدلال LLM را با مدل های آماری کلاسیک ترکیب کنیم
  • نحوه ساختار دهی داده ها و درخواست ها برای پیش بینی، ناهنجاری ها و محدودیت های دامنه

بدون تاخیر بیشتر، بیایید شروع کنیم.

مهندسی سریع برای تجزیه و تحلیل سری های زمانی

مهندسی سریع برای تجزیه و تحلیل سری های زمانی
تصویر توسط ویرایشگر

مقدمه

هر چقدر هم که عجیب به نظر برسد، مدل های زبان بزرگ (LLM) را می توان برای وظایف تجزیه و تحلیل داده ها، از جمله سناریوهای خاص مانند تجزیه و تحلیل سری های زمانی، مورد استفاده قرار داد. نکته کلیدی این است که مهارت های مهندسی سریع خود را به درستی به سناریوی تجزیه و تحلیل خاص ترجمه کنید.

این مقاله به هفت مورد اشاره می کند استراتژی های مهندسی سریع که می توان از آن برای اهرم استفاده کرد تجزیه و تحلیل سری های زمانی وظایف با LLM ها

جز در مواردی که خلاف آن گفته شود، توصیف این استراتژی‌ها با مثال‌های گویا همراه است که حول سناریوی داده‌های خرده‌فروشی می‌چرخد، به طور مشخص، با در نظر گرفتن مجموعه داده‌های سری زمانی متشکل از فروش روزانه در طول زمان برای تجزیه و تحلیل آن.

1. زمینه سازی ساختار زمانی

اول، یک دستور موثر برای به دست آوردن یک خروجی مدل مفید باید به آن کمک کند تا ساختار زمانی مجموعه داده سری زمانی را درک کند. این شامل ذکر احتمالی روندهای صعودی/نزولی، فصلی، چرخه های شناخته شده مانند تبلیغات یا تعطیلات و غیره است. این اطلاعات زمینه به LLM شما کمک می کند، به عنوان مثال، نوسانات زمانی را تفسیر کند – خوب، فقط همین: نوسانات، به جای نویز. در مجموع، توصیف ساختار مجموعه داده به وضوح در زمینه همراه با درخواست‌های شما اغلب فراتر از دستورالعمل‌های استدلالی پیچیده در دستورات است.

اعلان مثال:
در اینجا فروش روزانه (بر حسب واحد) برای 365 روز گذشته است. داده ها فصلی بودن هفتگی (فروش بیشتر در تعطیلات آخر هفته)، روند بلندمدت تدریجی افزایشی و افزایش ماهانه در پایان هر ماه به دلیل تبلیغات روز پرداخت را نشان می دهد.. هنگام پیش بینی 30 روز آینده از این دانش استفاده کنید.

2. استخراج ویژگی و سیگنال

به جای اینکه از مدل خود بخواهید پیش بینی های مستقیم را از روی اعداد خام انجام دهد، چرا از آن نمی خواهید ابتدا برخی از ویژگی های کلیدی را استخراج کند؟ این می تواند شامل الگوهای نهفته، ناهنجاری ها و همبستگی ها باشد. درخواست از LLM برای استخراج ویژگی ها و سیگنال ها و گنجاندن آنها در اعلان (مثلاً از طریق آمار خلاصه یا تجزیه) به آشکار شدن دلایل پشت پیش بینی ها یا نوسانات آینده کمک می کند.

اعلان مثال:
از 365 روز گذشته داده‌های فروش، میانگین فروش روزانه، انحراف استاندارد را محاسبه کنید، روزهایی را شناسایی کنید که فروش بیش از میانگین به اضافه دو برابر انحراف استاندارد باشد (یعنی انحرافات بالقوه)، و هر الگوی هفتگی یا ماهانه تکرار شونده را یادداشت کنید. سپس عواملی را تفسیر کنید که ممکن است روزهای یا افت فروش بالا را توضیح دهد، و هرگونه ناهنجاری غیرعادی را علامت‌گذاری کنید.

3. ترکیبی LLM + گردش کار آماری

بیایید با آن روبرو شویم: LLM ها در انزوا اغلب با وظایفی که نیاز به دقت عددی و گرفتن وابستگی های زمانی در سری های زمانی دارند، دست و پنجه نرم می کنند. به همین دلیل، ترکیب ساده استفاده از آن ها با مدل های آماری کلاسیک فرمولی برای به دست آوردن نتایج بهتر است. چگونه می توان یک گردش کار ترکیبی مانند این را تعریف کرد؟ ترفند این است که استدلال LLM – تفسیر سطح بالا، فرمول‌بندی فرضیه و درک زمینه – در کنار مدل‌های کمی مانند ARIMA، ETS یا موارد دیگر تزریق شود.

به عنوان مثال، LeMoLE (LLM-Enhanced ترکیبی از کارشناسان خطی) نمونه ای از یک رویکرد ترکیبی است که مدل های خطی را با ویژگی های مشتق شده سریع غنی می کند.

نتیجه، استدلال زمینه‌ای و دقت آماری را در هم می‌آمیزد: بهترین دو جهان.

4. نمایش داده مبتنی بر طرحواره

در حالی که مجموعه داده‌های سری زمانی خام معمولاً فرمت‌های نامناسبی برای ارسال به عنوان ورودی LLM هستند، استفاده از طرح‌واره‌های ساختاریافته مانند JSON یا جداول فشرده می‌تواند کلیدی باشد که به LLM اجازه می‌دهد تا این داده‌ها را بسیار قابل اعتمادتر تفسیر کند، همانطور که در چندین مطالعه نشان داده شده است.

نمونه ای از قطعه JSON که باید در کنار یک فرمان ارسال شود:

درخواست همراه کردن داده‌های JSON با:
با توجه به داده‌ها و ابرداده‌های JSON فوق، سری زمانی را تجزیه و تحلیل کنید و فروش 30 روز آینده را پیش‌بینی کنید.

5. الگوهای پیش بینی شده

طراحی و ساختاربندی مناسب الگوهای پیش‌بینی در اعلانات – مانند افق‌های کوتاه‌مدت در مقابل بلندمدت یا شبیه‌سازی سناریوهای خاص «چه می‌شود» – می‌تواند به هدایت مدل برای تولید پاسخ‌های قابل استفاده‌تر کمک کند. این رویکرد برای ایجاد بینش بسیار عملی برای تجزیه و تحلیل درخواستی شما موثر است.

مثال:

6. درخواست های تشخیص ناهنجاری

این یکی بیشتر مربوط به کار است و بر ایجاد درست دستورهایی تمرکز دارد که ممکن است نه تنها به پیش بینی با LLM ها کمک کند، بلکه به تشخیص ناهنجاری ها – در ترکیب با روش های آماری – و دلایل احتمالی آنها کمک کند، یا حتی پیشنهاد کند که چه چیزی باید بررسی شود. نکته کلیدی این است که یک بار دیگر ابتدا با ابزارهای سری زمانی سنتی پیش پردازش شود و سپس مدل را برای تفسیر یافته ها وادار کنید.

اعلان مثال:
“با استفاده از داده‌های فروش JSON، ابتدا هر روزی را که فروش بیش از 2 برابر انحراف استاندارد هفتگی از میانگین هفتگی انحراف دارد، پرچم‌گذاری کنید. سپس برای هر روز پرچم‌گذاری شده، دلایل احتمالی را توضیح دهید (مثلاً، عدم موجودی، تبلیغات، رویدادهای خارجی) و توصیه کنید که آیا بررسی شود (مثلاً بررسی سیاهه‌های موجودی، کمپین بازاریابی، ترافیک پای فروشگاه).

7. استدلال مبتنی بر دامنه

دانش دامنه مانند الگوهای فصلی خرده‌فروشی، اثرات تعطیلات، و غیره، بینش‌های ارزشمندی را آشکار می‌کند، و جاسازی آن در اعلان‌ها به LLMها کمک می‌کند تحلیل‌ها و پیش‌بینی‌هایی را انجام دهند که معنادارتر و همچنین قابل تفسیر هستند. این به استفاده از ارتباط “زمینه مجموعه داده”، هم از نظر معنایی و هم از نظر دامنه خاص، به عنوان فانوس دریایی که استدلال مدل را هدایت می کند، خلاصه می شود.

درخواستی مانند این می تواند به LLM کمک کند تا در پیش بینی جهش های آخر ماه یا کاهش فروش به دلیل تخفیف های تعطیلات بهتر عمل کند:
“این داده‌های فروش روزانه یک زنجیره خرده‌فروشی است. فروش در پایان هر ماه افزایش می‌یابد (مشتریان حقوق دریافت می‌کنند)، در تعطیلات رسمی کاهش می‌یابد، و در رویدادهای تبلیغاتی افزایش می‌یابد. همچنین گهگاه کمبود سهام وجود دارد که منجر به افت برای SKU‌های خاص می‌شود. از این دانش دامنه هنگام تجزیه و تحلیل سری و پیش‌بینی استفاده کنید.

بسته بندی

این مقاله هفت استراتژی مختلف را شرح می‌دهد که عمدتاً توسط مطالعات اخیر پایه‌گذاری و پشتیبانی می‌شوند تا اعلان‌های مؤثرتری برای تجزیه و تحلیل سری‌های زمانی و وظایف پیش‌بینی با کمک LLMها ایجاد کنند.







منبع: machinelearningmastery.com