نویسنده (ها): کلوین لو
در ابتدا منتشر شده در به سمت هوش مصنوعیبشر
اگر پیروی از MCP را دنبال کرده اید و مدتی را برای بررسی جزئیات آن گذرانده اید ، ممکن است آن را به عنوان یک ساختمان مهم برای سیستم های عامل آینده مشاهده کنید. با این حال ، شما همچنین ممکن است احساس کنید که کاملاً به اندازه کافی پیش نمی رود. شاید شما آن را در درجه اول به عنوان یک بسته بندی اساسی برای خدمات محلی درک کنید ، به طور بالقوه آن را برای نیازهای در مقیاس سازمانی ناکافی می دانید. برای کسانی که اینگونه احساس می کنند ، اخبار هیجان انگیز وجود دارد: گوگل فقط چند هفته به عقب پروتکل ارتباطات عامل خود را در Google اعلام کرد.
مقدمه MCP
پروتکل زمینه Model (MCP) را وارد کنید ، که توسط Anthropic به عنوان یک استاندارد باز معرفی شده است. هدف آن مقابله با چالش فزاینده ای بود LLMS برای بازی خوب با منابع و ابزارهای داده خارجی. در مورد چگونگی گذشته فکر کنید: ادغام AI که اغلب برای ساخت کانکتورهای سفارشی برای هر برنامه و نوشتن تعداد زیادی کد دیگ بخار برای کارهای مشترک مانند قالب بندی یا رسیدگی به خطاها نیاز دارد. این روش سنتی اغلب منجر به سردردهایی با مقیاس بندی می شد ، داده ها را متناقض می کرد و درهای خطرات امنیتی بیشتری را باز می کرد.
مهمتر از همه ، بدون استاندارد ، به اشتراک گذاشتن این تحولات یک چالش واقعی بود. MCP با هدف ساده سازی همه اینها با ارائه یک رابط استاندارد ، به برنامه های هوش مصنوعی اجازه می دهد تا به طور یکنواخت با ابزارها ، منابع ، و البته اعلان ها ارتباط برقرار کنند.
چرا ناکافی است
با وجود فواید آن ، MCP با محدودیت های مختلفی روبرو است:
- قابلیت های یکپارچه سازی محدود: اگرچه این پروتکل در نقشه راه برنامه ای برای ارائه احراز هویت و رمزگذاری قوی دارد ، اما اجرای فعلی فقط از ارتباطات مشتری سرور محلی پشتیبانی می کند.
- همکاری های پیچیده کار: پروتکل MCP قادر است خدمات محلی را برای اتصال مشتری ها در معرض نمایش بگذارد. با این حال ، فاقد قابلیت های سطح بالا برای ارتباطات بین عامل است.
همه این محدودیت ها به معنای MCP برای ساخت و ساز مناسب است عوامل سطح پایین -آنها را به عنوان کارگران پشت صحنه که وظیفه خاص و وظیفه گرا را اداره می کنند فکر کنید کار با استفاده از منابع محلی
MCP در طبیعت: مثال نماینده بیمه
تصویر هوش مصنوعی سیستم برای مصوبات بیمه. نماینده “رئیس” (یکی از کاربران با آنها در تعامل است) تصویر بزرگ را مدیریت می کند: برنامه ریزی گردش کار ، به روزرسانی وضعیت و واگذاری وظایف به زیرمجموعه های تخصصی. این زیرمجموعه ها MVP های واقعی در اینجا هستند:
- نماینده چک اعتباری: کارآگاه مالی.
- نماینده تشخیص کلاهبرداری: شکاک مشکوک.
- عامل قیمت گذاری: جادوگر شماره خرد.
- عامل ادغام مشتری: متخصص که می داند کیست.
MCP در اینجا می درخشد زیرا اساساً API جهان عامل -این به طور مرتب جزئیات اجرای کثیف را به هم می رساند و فقط آنچه را که لازم است در معرض دید قرار می دهد ، و آن را برای این کارهای با اندازه نیش مناسب می کند.
اما اینجا گرفتن …
در حالی که MCP برای کارهای فردی عالی است ، اما با آن دست و پنجه نرم می کند ارکستراسیونبشر تلاش برای ساختن یک عامل MCP که کارفرمایان در اطراف سایر عوامل – حتی در همان دستگاه – مانند گربه های گله دار است. و استقرار توزیع شده؟ آن را فراموش کنید (فعلاً). MCP این نوع توسعه را دشوارتر از گذشته نکرد ، بلکه در این سناریوها فقط بی ربط است.
بنابراین در حالی که MCP برخی از سردردهای ادغام را حل می کند ، این گلوله جادویی برای سمفونی های پیچیده و چند عامل نیست. این تکنواز است ، نه هادی.
A2a: مترجم جهانی
پروتکل عامل به عامل (A2A) که توسط Google معرفی شده است ، به شکاف بحرانی در اکوسیستم های هوش مصنوعی می پردازد: گردش کار تکه تکه شده ناشی از عوامل جدا شده. بر خلاف MCP ، که بر ادغام منبع داده ها ، استانداردهای A2A متمرکز است ارتباط بین عامل، امکان همکاری در بین نمایندگان. مزایای اصلی عبارتند از:
- “کارتهای عامل” = کارت ویزیت AI
هر نماینده خود را با مشخصات JSON شسته و رفته (مهارت ها ، نقاط پایانی ، الزامات AUTH) معرفی می کند. بی دست و پا نیست “بنابراین … چه دقیقاً می توانید انجام دهید؟ ” مکالمات - مدیریت وظیفه که شما را شبح نمی کند
به روزرسانی های وضعیت روشن (“ارسال شده” → “کار” → “انجام شده”) گردش کار را همگام نگه دارید. حتی بهتر؟ دستگیره کارهای طولانی مدت (ساعت ها یا روزهای تحقیق را فکر کنید) با گزارش های پیشرفت زنده – دیگر تعجب نمی کنید که آیا هوش مصنوعی شما را فراموش کرده است یا خیر. - با هر چیزی کار می کند (بله ، حتی فیلم)
به متن نیاز دارید؟ فرم ها؟ پخش صوتی؟ A2a اهمیتی نمی دهد. این است روش، بنابراین نمایندگان می توانند در مورد نحوه گپ زدن در پرواز مذاکره کنند. - امنیت بدون سردرد
ساخته شده HTTP ، SSE و JSON-RPC، به همان اندازه API شرکت مورد علاقه شما امن است – اما به روش انعطاف پذیر تر.
در اعلامیه Google در مورد انتشار A2A ، آنها گفتند A2A “تعارف MCP”:
اجرای
A2A برای سازگاری از استانداردهای وب موجود استفاده می کند. قابلیت های آن عبارتند از:
- کشف قابلیت: نمایندگان می توانند قابلیت های خود را با استفاده از “کارت عامل” در قالب JSON تبلیغ کنند و به نماینده مشتری اجازه می دهند بهترین عامل را که می تواند یک کار را انجام دهد و از A2A استفاده کند تا با عامل از راه دور ارتباط برقرار کند.
- مدیریت کار: ارتباط بین مشتری و عامل از راه دور به سمت اتمام کار گرایش دارد ، که در آن عوامل برای تحقق درخواست های کاربر نهایی کار می کنند. این شیء “کار” توسط پروتکل تعریف شده و دارای چرخه عمر است. این می تواند بلافاصله تکمیل شود یا برای کارهای طولانی مدت ، هر یک از نمایندگان می توانند در آخرین وضعیت تکمیل یک کار با یکدیگر همگام شوند. خروجی یک کار به عنوان “مصنوعات” شناخته می شود.
- همکاری: نمایندگان می توانند پیام های دیگری را برای برقراری ارتباط زمینه ، پاسخ ، آثار باستانی یا دستورالعمل های کاربر ارسال کنند.
- مذاکره تجربه کاربر: هر پیام شامل “قطعات” است که یک قطعه کاملاً تشکیل شده است ، مانند یک تصویر تولید شده. هر قسمت دارای یک نوع محتوای مشخص است که به عوامل مشتری و از راه دور اجازه می دهد تا با فرمت صحیح مورد نیاز مذاکره کنند و صریحاً شامل مذاکرات مربوط به قابلیت های UI کاربر – EG ، IFRAMES ، VIDEO ، فرم های وب و موارد دیگر هستند.
بر خلاف بسیاری از محصولات قبلی Google که تازه از آزمایشگاه ها تحویل داده می شوند ، A2A یک حرکت استراتژیک آشکار است. در اولین روز از انتشار ، گوگل لیست طولانی از کاربران تأثیرگذار شرکت را اعلام کرد. این یکی دیگر از تفاوت های کلیدی بین A2A و MCP است – A2A به عنوان یک راه حل سازمانی قرار گرفت.
اسکن از طریق لیست طولانی سرورهای MCP در مقابل شرکای Google که به پروتکل A2A کمک می کنند ، به راحتی می توان این احساس را ایجاد کرد که جامعه MCP فرهنگ منبع باز را نشان می دهد: منحنی یادگیری نرم تر ، گزینه های بیشتر ، جامعه بزرگتر ، کیفیت متنوع و کمی هرج و مرج. در مقابل ، A2A یک سبک تجاری ارائه می دهد: اقتدار بیشتر ، گزینه های کمتر ، کیفیت بالاتر ، جامعه کوچکتر و سازمان یافته بهتر.
شما ممکن است هرگز از طول کاتالوگ های سرویس A2A مانند زمانی که برای اولین بار لیست سرور MCP را دیدید ، شوکه نشوید ، اما A2A هیچ شکی در گزینه های مهم در راه حل های سازمانی شما نیست.
آنچه حل نشده است
ترکیبی از A2A و MCP پایه و اساس محکمی برای ارتباطات عامل را نشان می دهد ، اما محدودیت های آنها چالش های عمیق تری در توسعه عامل محور را نشان می دهد-نه فقط در طراحی پروتکل ، بلکه در نحوه مفهوم سازی و معماری سیستم های چند عامل.
مشکل نامگذاری: نشانه ای از عدم بلوغ
برنامه عامل تأیید بیمه را در نظر بگیرید: عوامل مختلف نقش های متمایز را ارائه می دهند و به الگوهای طراحی متفاوتی نیاز دارند ، اما ما برای طبقه بندی آنها فاقد اصطلاحات استاندارد هستیم. آیا باید اصطلاحاتی مانند اتخاذ کنیم عامل مدیریتی در مقابل منشی؟ عدم وجود یک واژگان مشترک تأکید می کند که چگونه این زمینه همچنان تازه مانده است.
چالش های مهم در MCP و A2A
در حالی که این پروتکل ها قابلیت همکاری را پیش می برند ، چندین موضوع حل نشده نیاز به بررسی دارند:
- خطرات امنیتی در انتخاب نماینده
سیستم های فعلی برای تعیین مناسب بودن به توضیحات نقطه پایانی متکی هستند – یک رویکرد ساده لوحانه که در برابر بهره برداری آسیب پذیر است. اگر یک سرویس مخرب خود را به عنوان قانونی مبدل کند ، آیا چارچوب های موجود می توانند با اطمینان آن را رد کنند؟ امنیت نماینده همچنان یک مرز توسعه نیافته است که برای بردارهای حمله جدید رسیده است. - ابهام در توضیحات خدمات
بر خلاف API های سنتی ، جایی که نقاط پایانی صریحاً توسط URL ها تعریف می شوند ، درخواست های مسیر سیستم های عامل بر اساس توضیحات معنایی. تعاریف خدمات همپوشانی یا مبهم ، خطای سوء استفاده را به خطر می اندازد ، زیرا LLM ها فاقد تشخیص درگیری بین پیشنهادات مشابه هستند. - معضل نسخه
ملوان شیوه هایی مانند استقرار آبی-سبز-که در آن نسخه های چند مدل همزیستی هستند-با عدم وجود پروتکل های نسخه ای A2A و MCP برخورد می کنند. آیا مشتری باید توضیحات سرویس را ذخیره کند یا آنها را به صورت پویا در هر فراخوانی واگذار کند؟ هیچ یک از رویکردها استاندارد نشده و قابلیت اطمینان را نامشخص می کند. - کنترل حافظه ناکافی
حافظه مشترک سنگ بنای همکاری عامل است ، اما هیچ یک از پروتکل ها چگونگی تقسیم داده های حساس را مشخص نمی کنند. یک نماینده حقوقی ممکن است به جزئیات قرارداد نیاز داشته باشد ، در حالی که یک نماینده حسابداری به سابقه پرداخت نیاز دارد-اما دسترسی متقابل باید محدود شود. پیاده سازی های فعلی فاقد حاکمیت حافظه دانه ای هستند. - رسیدگی به خطای نامشخص
نرم افزار سنتی خطاها را به سختی تعریف می کند ، اما سیستم های عامل در منطقه خاکستری کار می کنند. اگر یک LLM ورودی های پوچ یا داده های کافی را دریافت کند ، چه می شود؟ و اگر مشتری بخواهد نتیجه یک نماینده را به چالش بکشد ، چه می شود؟ پروتکل A2A دارای ورودی TAG مکالمه چند چرخش را امکان پذیر می کند ، اما اگر چندین عامل در انتظار ورودی متقابل باشند ، ممکن است بن بست ها ایجاد شود. - کسری برنامه ریزی
برخی از پیاده سازی ها جریان کار با ضریب کدگذاری ، آنها را به رفتارهای قطعی و چت مانند کاهش می دهد. برنامه های عامل واقعی باید LLMS را برای برنامه ریزی پویا اهرم کنند – اما بیشتر امروزه هنگام انحراف از مسیرهای نوشته شده ، غیرقابل پیش بینی هستند. در حالی که این کمبود بیش از دامنه A2A و MCP است ، تکرارهای پروتکل آینده باید استدلال سطح بالاتر را در خود جای دهد.
حرکت به جلو
این شکاف ها نشان می دهد که توسعه عامل صرفاً یک چالش فنی نیست ، بلکه یک تغییر پارادایم است که به فلسفه های جدید طراحی نیاز دارد. با بالغ شدن این میدان ، پروتکل ها باید فراتر از اتصال – به سمت امنیت ، سازگاری و عمدی – تکامل یابد.
منتشر شده از طریق به سمت هوش مصنوعی