یک رویکرد مدل ترکیبی برای خوشه‌بندی داده‌های سری زمانی


نویسنده(های): شنگانگ لی

در ابتدا منتشر شد به سمت هوش مصنوعی.

این داستان فقط برای اعضا در اختیار ماست. برای دسترسی به تمام Medium ارتقا دهید.

خوشه‌بندی سری‌های زمانی با استفاده از مدل‌های رگرسیون خودکار، میانگین‌های متحرک و توابع روند غیرخطی

عکس ریکاردو گومز فرشته در Unsplash

خوشه بندی داده های سری زمانی، مانند قیمت سهام یا ژن بیان، اغلب دشوار است. روش هایی مانند K-means with همبستگی فاصله ممکن است داده ها را بر اساس شکل گروه بندی کند اما الگوهای پیچیده تر و در حال تحول را نادیده بگیرد.

به عنوان مثال، قیمت سهام به طور تصادفی حرکت نمی کند، و ژن سطوح بیان به فرآیندهای بیولوژیکی پیچیده واکنش نشان می دهند. هر دو نیاز به رویکرد متفکرانه تری دارند.

اینجاست که مدل مخلوط وارد می‌شود. با استفاده از مدل‌های AR، MA، و توابع روند به خوشه‌بندی مؤثر داده‌های سری زمانی، آشکار کردن روابط و الگوهای اصلی کمک می‌کند.

پیش‌بینی این نوع سری‌های زمانی سخت است، زیرا قیمت سهام اغلب از یک راهپیمایی تصادفی پیروی می‌کند و بیان ژن به دلایل زیادی می‌تواند نوسان داشته باشد. اما با خوشه‌بندی این منحنی‌ها در گروه‌های معنادار، می‌توانیم الگوهایی را کشف کنیم که به مدل‌سازی یا تصمیم‌گیری کمک می‌کنند.

این روش به ما نشان می دهد که در شرایط مختلف چه اتفاقی می افتد و درک بهتری از داده های پویا ارائه می دهد. چه در امور مالی و چه در زیست شناسی، این رویکرد ساختارهای پنهانی را در داده ها نشان می دهد که روش های خوشه بندی ساده تمایل به نادیده گرفتن آنها دارند.

وقتی داده‌های سری زمانی زیادی دارید، مانند فروش در زنجیره تامین، بیان ژن یا سهام… وبلاگ کامل را به صورت رایگان در Medium بخوانید.

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/machine-learning/a-mixture-model-approach-for-clustering-time-series-data