با Magentic-One آشنا شوید: چارچوب چند عاملی جدید مایکروسافت برای حل وظایف پیچیده

نویسنده(های): خسوس رودریگز

در ابتدا منتشر شد به سمت هوش مصنوعی.

من اخیراً یک آموزش مبتنی بر هوش مصنوعی را شروع کردم خبرنامه، که در حال حاضر بیش از 170000 مشترک دارد. TheSequence یک no-BS است (به معنی بدون هیپ، بدون خبری و غیره) ML-محور خبرنامه خواندن آن 5 دقیقه طول می کشد. هدف این است که شما را به روز نگه دارید یادگیری ماشینی پروژه ها، مقالات تحقیقاتی و مفاهیم. لطفا با عضویت در زیر آن را امتحان کنید:

TheSequence | خسوس رودریگز | زیر پشته

بهترین منبع برای به‌روز ماندن با پیشرفت‌های یادگیری ماشین، هوش مصنوعی و داده‌ها…

thesequence.substack.com

یک هفته دیگر یک چارچوب عامل دیگر. بازار عوامل هوش مصنوعی به همان اندازه که پراکنده است داغ به نظر می رسد، اما سطح نوآوری قابل توجه است. یکی از حوزه هایی که به نظر می رسد سطح فوق العاده ای از توجه را به خود جلب کرده است، سیستم های چند عاملی است. مایکروسافت یکی از شرکت‌هایی است که با فریمورک‌هایی مانند AutoGen و TaskWeaver در حوزه نمایندگی‌ها واقعاً فعال است. اخیراً، مایکروسافت منبع باز چارچوب جدیدی را بر روی سیستم های چند عاملی متمرکز کرده است.

Magentic-One یک سیستم چند عامله عمومی جدید است که توسط Microsoft Research توسعه یافته است، که برای انجام وظایف پایان باز بر اساس اطلاعات وب و فایل در دامنه های مختلف طراحی شده است. این مقاله به بررسی معماری Magentic-One، قابلیت‌های آن، نتایج ارزیابی و خطرات احتمالی می‌پردازد.

معماری

Magentic-One بر اساس معماری چند عاملی ساخته شده است که در آن یک عامل **Orchestrator** چهار عامل دیگر را در اجرای کار رهبری می کند. این رویکرد به ماژولار بودن و انعطاف پذیری اجازه می دهد که از قابلیت های سیستم های تک عامل سنتی فراتر رود.

عامل ارکستراتور مسئول موارد زیر است:

· تجزیه وظایف و برنامه ریزی برای اجرای آنها.

· هدایت سایر عوامل برای انجام وظایف فرعی.

· نظارت بر پیشرفت کلی کار.

· انجام اقدامات اصلاحی در صورت لزوم.

Magentic-One از یک سیستم دو حلقه ای برای مدیریت وظایف استفاده می کند:

· حلقه بیرونی: Task Ledger را مدیریت می کند که حقایق، حدس ها و برنامه کلی کار را ذخیره می کند.

· حلقه داخلی: دفتر کل پیشرفت را کنترل می کند، وضعیت فعلی تکالیف و وظایف فرعی را ردیابی می کند.

ارکستراتور فرآیند را با تهیه یک طرح و ثبت اطلاعات مربوطه در Task Ledger آغاز می کند. سپس هر مرحله از طرح در دفتر کل پیشرفت پیگیری می شود. ارکستراتور وظایف فرعی را به سایر عوامل اختصاص می دهد، پیشرفت آنها را نظارت می کند و بر اساس آن دفتر کل پیشرفت را به روز می کند. اگر پیشرفت کافی صورت نگرفت، ارکستراتور می‌تواند دفتر کار را تنظیم کرده و طرح جدیدی را تدوین کند.

نمایندگی های تخصصی

Magentic-One علاوه بر ارکستراتور شامل چهار عامل تخصصی دیگر نیز می باشد:

· وب‌سرفر: یک عامل آموزش دیده برای تعامل با مرورگرهای وب، قادر به ناوبری، اقدامات صفحه وب و استخراج اطلاعات. WebSurfer از درخت دسترسی مرورگر و تکنیک‌های تحریک برای تکمیل اقدامات خود استفاده می‌کند.

· FileSurfer: عاملی که در خواندن و پیمایش فایل‌های محلی انواع مختلف با استفاده از یک برنامه پیش‌نمایش فایل مبتنی بر علامت‌گذاری مهارت دارد. این عامل می تواند محتویات دایرکتوری را فهرست کند و در یک ساختار پوشه حرکت کند.

· کدگذار: عاملی که به طور خاص برای نوشتن کد، تجزیه و تحلیل داده های سایر عوامل و ایجاد خروجی های جدید طراحی شده است.

· ترمینال کامپیوتر: این عامل دسترسی به پوسته کنسول را برای اجرای کد تولید شده توسط Coder و نصب کتابخانه های برنامه نویسی لازم فراهم می کند.

انعطاف پذیری مدل ها

Magentic-One به گونه ای طراحی شده است که مدل آگنوستیک باشد. در حالی که مدل پیش‌فرض برای همه نمایندگی‌ها GPT-4o است، پیکربندی‌های مختلف می‌توانند از مدل‌های مختلف زبان بزرگ (LLM) و مدل‌های زبان تخصصی (SLM) استفاده کنند. این سازگاری تضمین می کند که Magentic-One می تواند برای وظایف خاص و محدودیت های منابع بهینه شود.

کد زیر نحوه تعامل عوامل Magentic-One را نشان می دهد:

```python
# Initialize the Magentic-One agents
from autogen.magentic_one import MagenticOneAgent
orchestrator = MagenticOneAgent()
# Define the task
task = "Download a file from the internet, execute code to interact with the file"
# Run the task
orchestrator.run(task)
```

ارزیابی

عملکرد Magentic-One با استفاده از AutoGenBench، ابزاری که برای ارزیابی سیستم‌های عامل توسعه یافته است، ارزیابی شد. معیارهایی که برای ارزیابی انتخاب شدند GAIA، AssistantBench و WebArena بودند که هر کدام شامل وظایف چند مرحله‌ای هستند که نیاز به برنامه‌ریزی و استفاده از مرورگرهای وب دارند.

نتایج نشان داد که Magentic-One عملکرد رقابتی را در مقایسه با سایر روش‌های پیشرفته از خود نشان می‌دهد. از نظر آماری نتایج مشابهی با روش‌های موجود در GAIA و AssistantBench به دست می‌آورد، در حالی که عملکرد رقابتی را در WebArena نشان می‌دهد.

برخی از خطرات

افزایش قابلیت های سیستم های عاملی مانند Magentic-One خطرات بالقوه ای را به همراه دارد. از آنجا که Magentic-One در دنیای واقعی عمل می کند، اقدامات آن می تواند عواقب ناخواسته ای داشته باشد. نمونه هایی از خطرات مشاهده شده عبارتند از:

· تلاش های مکرر برای ورود به سیستم که منجر به تعلیق حساب می شود.

· تلاش برای مشارکت دادن انسان ها در انجام وظایف از طریق رسانه های اجتماعی یا ایمیل.

برای مقابله با این خطرات، مایکروسافت استراتژی های کاهشی مختلفی را اجرا کرده است:

· تمرینات تیم قرمز برای شناسایی آسیب پذیری های احتمالی.

· دستورالعمل های ایمنی و بهترین شیوه ها برای استفاده از Magentic-One.

· مکانیسم های نظارت و نظارت.

· تاکید بر استفاده از مدل های هم تراز با فیلترهای قبل و بعد از نسل.

بعد چه می آید؟

تحقیقات آینده در سیستم های عامل و ایمنی احتمالاً بر موارد زیر متمرکز خواهد شد:

· پیش بینی خطرات در حال ظهور، از جمله حملات فیشینگ و اطلاعات نادرست.

· ایجاد مکانیسم هایی برای عوامل برای درک برگشت پذیری اعمالشان.

· یکپارچه سازی سیستم های انسان در حلقه برای نقاط تصمیم گیری حیاتی.

Magentic-One یک پیشرفت قابل توجه در زمینه سیستم های عامل است که قادر به حل وظایف پیچیده در محیط های مبتنی بر وب و فایل است. معماری چند عاملی، مدولار بودن و طراحی مدل-آگنوستیک آن انعطاف پذیری و سازگاری را ارائه می دهد. در حالی که خطرات بالقوه وجود دارد، تحقیقات مداوم و تلاش‌های کاهشی برای اطمینان از توسعه مسئولانه و ایمن چنین سیستم‌های هوش مصنوعی قدرتمند بسیار مهم است.

منتشر شده از طریق به سمت هوش مصنوعی

منبع: https://towardsai.net/p/artificial-intelligence/meet-magentic-one-microsofts-new-multi-agent-framework-for-solving-complex-tasks