نویسنده (ها): شنگگانگ لی
در ابتدا منتشر شده در به سمت هوش مصنوعیبشر
استفاده از حالت-فضای پیشرفته پیشرفت چند سر و بهینه سازی سیاست نسبی گروه (GRPO) برای پیش بینی تطبیقی
این داستان فقط عضو بر ما است. برای دسترسی به همه رسانه ها ارتقا دهید.
من از فناوری Deepseek تحت تأثیر قرار گرفتم-تکنیک های کارآمد توجه نهفته چند سر (MLA) و تکنیک های بهینه سازی نسبی گروه (GRPO) به من الهام بخش بود که آنها را در پیش بینی سری های زمانی چند قطعه استفاده کنم.
در رویکرد ما ، ما MLA را به آنچه که ما می نامیم MLA-mamba ، گسترش می دهیم و به ویژگی های نهفته اجازه می دهیم با استفاده از یک مدل فضای دولتی با فعال سازی های غیرخطی ، به طور پویا به صورت پویا تکامل یابد. این به مدل ما یک حافظه تطبیقی می دهد که مانند یک تیم فروش که استراتژی خود را در طول افزایش بازار تطبیق می دهد ، با روندهایی تنظیم می شود.
در عین حال ، GRPO یک فرآیند تصمیم گیری هوشمندانه را معرفی می کند که با مقایسه پیش بینی های مربوط به یک پایه ، شبیه به پیش بینی های مدیریتی در پرواز ، به طور مداوم پیش بینی ها را تصفیه می کند. این تنظیم پویا به مدل ما کمک می کند تا به طور مؤثر در برابر تغییرات ناگهانی در الگوهای فروش پاسخ دهد.
ما رویکرد خود را با مدل های کلاسیک ARMA و استاندارد مقایسه می کنیم گودالشبکه های مبتنی بر در حالی که ARMA روند خطی و وابستگی های زمانی GRUS را به دست می آورد ، چارچوب Deepseek-TS ما برای مدل سازی روابط پیچیده بین محصول و سازگاری با پویایی غیرخطی طراحی شده است و در نتیجه پیش بینی های دقیق تر و قوی تر است.
در بخش های بعدی ، ما جزئیات فنی چارچوب های گسترده MLA (MLA-Mamba) و GRPO را تجزیه می کنیم و نشان می دهیم که چگونه آنها … وبلاگ کامل را به صورت رایگان در رسانه بخوانیدبشر
منتشر شده از طریق به سمت هوش مصنوعی