نویسنده(های): خسوس رودریگز
در ابتدا منتشر شد به سمت هوش مصنوعی.
من اخیراً یک آموزش مبتنی بر هوش مصنوعی را شروع کردم خبرنامه، که در حال حاضر بیش از 170000 مشترک دارد. TheSequence یک no-BS است (به معنی بدون هیپ، بدون خبری و غیره) ML-محور خبرنامه خواندن آن 5 دقیقه طول می کشد. هدف این است که شما را به روز نگه دارید یادگیری ماشینی پروژه ها، مقالات تحقیقاتی و مفاهیم. لطفا با عضویت در زیر آن را امتحان کنید:
TheSequence | خسوس رودریگز | زیر پشته
بهترین منبع برای بهروز ماندن با پیشرفتهای یادگیری ماشین، هوش مصنوعی و دادهها…
thesequence.substack.com
یک هفته دیگر یک چارچوب عامل دیگر. بازار عوامل هوش مصنوعی به همان اندازه که پراکنده است داغ به نظر می رسد، اما سطح نوآوری قابل توجه است. یکی از حوزه هایی که به نظر می رسد سطح فوق العاده ای از توجه را به خود جلب کرده است، سیستم های چند عاملی است. مایکروسافت یکی از شرکتهایی است که با فریمورکهایی مانند AutoGen و TaskWeaver در حوزه نمایندگیها واقعاً فعال است. اخیراً، مایکروسافت منبع باز چارچوب جدیدی را بر روی سیستم های چند عاملی متمرکز کرده است.
Magentic-One یک سیستم چند عامله عمومی جدید است که توسط Microsoft Research توسعه یافته است، که برای انجام وظایف پایان باز بر اساس اطلاعات وب و فایل در دامنه های مختلف طراحی شده است. این مقاله به بررسی معماری Magentic-One، قابلیتهای آن، نتایج ارزیابی و خطرات احتمالی میپردازد.
معماری
Magentic-One بر اساس معماری چند عاملی ساخته شده است که در آن یک عامل **Orchestrator** چهار عامل دیگر را در اجرای کار رهبری می کند. این رویکرد به ماژولار بودن و انعطاف پذیری اجازه می دهد که از قابلیت های سیستم های تک عامل سنتی فراتر رود.
عامل ارکستراتور مسئول موارد زیر است:
· تجزیه وظایف و برنامه ریزی برای اجرای آنها.
· هدایت سایر عوامل برای انجام وظایف فرعی.
· نظارت بر پیشرفت کلی کار.
· انجام اقدامات اصلاحی در صورت لزوم.
Magentic-One از یک سیستم دو حلقه ای برای مدیریت وظایف استفاده می کند:
· حلقه بیرونی: Task Ledger را مدیریت می کند که حقایق، حدس ها و برنامه کلی کار را ذخیره می کند.
· حلقه داخلی: دفتر کل پیشرفت را کنترل می کند، وضعیت فعلی تکالیف و وظایف فرعی را ردیابی می کند.
ارکستراتور فرآیند را با تهیه یک طرح و ثبت اطلاعات مربوطه در Task Ledger آغاز می کند. سپس هر مرحله از طرح در دفتر کل پیشرفت پیگیری می شود. ارکستراتور وظایف فرعی را به سایر عوامل اختصاص می دهد، پیشرفت آنها را نظارت می کند و بر اساس آن دفتر کل پیشرفت را به روز می کند. اگر پیشرفت کافی صورت نگرفت، ارکستراتور میتواند دفتر کار را تنظیم کرده و طرح جدیدی را تدوین کند.
نمایندگی های تخصصی
Magentic-One علاوه بر ارکستراتور شامل چهار عامل تخصصی دیگر نیز می باشد:
· وبسرفر: یک عامل آموزش دیده برای تعامل با مرورگرهای وب، قادر به ناوبری، اقدامات صفحه وب و استخراج اطلاعات. WebSurfer از درخت دسترسی مرورگر و تکنیکهای تحریک برای تکمیل اقدامات خود استفاده میکند.
· FileSurfer: عاملی که در خواندن و پیمایش فایلهای محلی انواع مختلف با استفاده از یک برنامه پیشنمایش فایل مبتنی بر علامتگذاری مهارت دارد. این عامل می تواند محتویات دایرکتوری را فهرست کند و در یک ساختار پوشه حرکت کند.
· کدگذار: عاملی که به طور خاص برای نوشتن کد، تجزیه و تحلیل داده های سایر عوامل و ایجاد خروجی های جدید طراحی شده است.
· ترمینال کامپیوتر: این عامل دسترسی به پوسته کنسول را برای اجرای کد تولید شده توسط Coder و نصب کتابخانه های برنامه نویسی لازم فراهم می کند.
انعطاف پذیری مدل ها
Magentic-One به گونه ای طراحی شده است که مدل آگنوستیک باشد. در حالی که مدل پیشفرض برای همه نمایندگیها GPT-4o است، پیکربندیهای مختلف میتوانند از مدلهای مختلف زبان بزرگ (LLM) و مدلهای زبان تخصصی (SLM) استفاده کنند. این سازگاری تضمین می کند که Magentic-One می تواند برای وظایف خاص و محدودیت های منابع بهینه شود.
کد زیر نحوه تعامل عوامل Magentic-One را نشان می دهد:
```python
# Initialize the Magentic-One agents
from autogen.magentic_one import MagenticOneAgent
orchestrator = MagenticOneAgent()
# Define the task
task = "Download a file from the internet, execute code to interact with the file"
# Run the task
orchestrator.run(task)
```
ارزیابی
عملکرد Magentic-One با استفاده از AutoGenBench، ابزاری که برای ارزیابی سیستمهای عامل توسعه یافته است، ارزیابی شد. معیارهایی که برای ارزیابی انتخاب شدند GAIA، AssistantBench و WebArena بودند که هر کدام شامل وظایف چند مرحلهای هستند که نیاز به برنامهریزی و استفاده از مرورگرهای وب دارند.
نتایج نشان داد که Magentic-One عملکرد رقابتی را در مقایسه با سایر روشهای پیشرفته از خود نشان میدهد. از نظر آماری نتایج مشابهی با روشهای موجود در GAIA و AssistantBench به دست میآورد، در حالی که عملکرد رقابتی را در WebArena نشان میدهد.
برخی از خطرات
افزایش قابلیت های سیستم های عاملی مانند Magentic-One خطرات بالقوه ای را به همراه دارد. از آنجا که Magentic-One در دنیای واقعی عمل می کند، اقدامات آن می تواند عواقب ناخواسته ای داشته باشد. نمونه هایی از خطرات مشاهده شده عبارتند از:
· تلاش های مکرر برای ورود به سیستم که منجر به تعلیق حساب می شود.
· تلاش برای مشارکت دادن انسان ها در انجام وظایف از طریق رسانه های اجتماعی یا ایمیل.
برای مقابله با این خطرات، مایکروسافت استراتژی های کاهشی مختلفی را اجرا کرده است:
· تمرینات تیم قرمز برای شناسایی آسیب پذیری های احتمالی.
· دستورالعمل های ایمنی و بهترین شیوه ها برای استفاده از Magentic-One.
· مکانیسم های نظارت و نظارت.
· تاکید بر استفاده از مدل های هم تراز با فیلترهای قبل و بعد از نسل.
بعد چه می آید؟
تحقیقات آینده در سیستم های عامل و ایمنی احتمالاً بر موارد زیر متمرکز خواهد شد:
· پیش بینی خطرات در حال ظهور، از جمله حملات فیشینگ و اطلاعات نادرست.
· ایجاد مکانیسم هایی برای عوامل برای درک برگشت پذیری اعمالشان.
· یکپارچه سازی سیستم های انسان در حلقه برای نقاط تصمیم گیری حیاتی.
Magentic-One یک پیشرفت قابل توجه در زمینه سیستم های عامل است که قادر به حل وظایف پیچیده در محیط های مبتنی بر وب و فایل است. معماری چند عاملی، مدولار بودن و طراحی مدل-آگنوستیک آن انعطاف پذیری و سازگاری را ارائه می دهد. در حالی که خطرات بالقوه وجود دارد، تحقیقات مداوم و تلاشهای کاهشی برای اطمینان از توسعه مسئولانه و ایمن چنین سیستمهای هوش مصنوعی قدرتمند بسیار مهم است.
منتشر شده از طریق به سمت هوش مصنوعی