گوگل Gemini 2.0 را با پیوند خودکار راه اندازی کرد

گوگل در عرضه Gemini 2.0، خانواده پرچمدار جدید خود، از “تجربه های نمایندگی” استقبال می کند. هوش مصنوعی مولد انتظار می رود با ChatGPT با OpenAI o1، GitHub Copilot و آمازون نوا.

این غول فناوری اولین مدل Gemini 2.0 Flash را در 11 دسامبر برای توسعه دهندگان جهانی از طریق Gemini API در Google AI Studio و Vertex AI منتشر کرد. مصرف‌کنندگان می‌توانند انتظار داشته باشند که Gemini 2.0 بر جستجوی گوگل و مرورهای هوش مصنوعی تأثیر بگذارد، با آزمایش محدود از هفته آینده. عرضه عمومی برای اوایل سال 2025 تنظیم شده است.

از طریق Gemini 2.0، توسعه‌دهندگان می‌توانند به ورودی و خروجی متن چندوجهی دسترسی داشته باشند، در حالی که شرکای دسترسی اولیه می‌توانند تبدیل متن به گفتار و تولید تصویر بومی را آزمایش کنند. برنامه Gemini به زودی با Gemini 2.0 Flash به روز می شود. گوگل در یک بیانیه مطبوعاتی اعلام کرد.

انتظار می‌رود در ماه ژانویه در دسترس بودن عمومی و مدل‌های اضافی مانند مدل پایه Gemini 2.0 عرضه شود.

Gemini 2.0 چیست؟

Gemini 2.0 یک مدل هوش مصنوعی مولد چندوجهی است که بر روی سخت افزار Trillium گوگل اجرا می شود. این طراحی شده است تا با کمک به خلاصه کردن اطلاعات، انجام جستجوهای وب و حتی تعامل طبیعی تر با ابزارها یا برنامه ها، وظایف آنلاین را آسان تر و شهودی تر کند.

گوگل اشاره کرد که Gemini 2.0 Flash دو برابر سریعتر از نسخه قبلی خود، 1.5 Pro است و در معیارهای عملکرد هوش مصنوعی مانند MMLU-PRO و LiveCodeBench از آن پیشی گرفته است.

ساندار پیچای، مدیرعامل گوگل در بیانیه ای گفت: «اگر Gemini 1.0 درباره سازماندهی و درک اطلاعات بود، Gemini 2.0 برای مفیدتر کردن آن است.

چیزی که Gemini 2.0 را متمایز می کند، قابلیت های عاملی آن است. پیچای این قابلیت‌ها را اینگونه توصیف کرد که مدل را قادر می‌سازد «درباره دنیای اطراف شما بیشتر بفهمد، چند قدم پیش‌تر فکر کند و از طرف شما با نظارت شما اقدام کند».

گوگل همچنین تاکید کرد که Gemini 2.0 خود را از این طریق متمایز می کند:

پردازش چندوجهی
توانایی درک کتاب های طولانی یا بخش های وسیع وب.
فراخوانی تابع
“استفاده از ابزار بومی.”
“پیگیری و برنامه ریزی دستورالعمل پیچیده.”

استفاده از ابزار بومی به هوش مصنوعی اجازه می دهد تا ابزارهایی مانند جستجوی گوگل و اجرای کد را برای انجام اقدامات مستقل ترکیب کند. از نظر عملی، گاهی اوقات شبیه پروژه Astra گوگل به نظر می رسد – یک برنامه اندرویدی که اکنون در حال آزمایش است و از دوربین گوشی و استدلال Gemini برای پاسخ به سوالات در مورد جهان در زمان واقعی استفاده می کند. Project Astra می تواند تا 10 دقیقه ویدیو را در یک زمان تجزیه و تحلیل کند.

گوگل همچنین پروژه های اضافی، نمونه های اولیه را اعلام می کند

پروژه مارینر

یکی دیگر از شواهد این مفهوم، Project Mariner است، یک افزونه آزمایشی کروم که تلاش گوگل برای فعال کردن Gemini برای خواندن صفحه‌های مرورگر را نشان می‌دهد. کاربران می توانند از آن بخواهند که صفحات وب را خلاصه کند یا خرید کنند.

دمیس حسابیس، مدیرعامل Google DeepMind و Koray Kavukcuoglu: «هنوز زود است، اما Project Mariner نشان می‌دهد که از نظر فنی امکان پیمایش در یک مرورگر وجود دارد، حتی اگر امروزه انجام وظایف همیشه دقیق و کند نیست، که به سرعت در طول زمان بهبود می‌یابد. مدیر ارشد فناوری Google DeepMind در این بیانیه نوشت.

ببینید: گوگل تولید تخصصی تصویر و ویدیو را فاش کرد مدل های هوش مصنوعی در اوایل دسامبر نیز.

تحقیق عمیق

Deep Research که با اشتراک Gemini Advanced در دسترس است، یک مدل آزمایشی است که به وب متصل است. برای ایجاد طرح‌ها و طرح‌های تحقیقاتی برای دانش‌آموزان، دانشمندان یا کارآفرینان طراحی شده است. این ابزار موضوع مورد نظر شما را در وب جستجو می کند، یک طرح تحقیقاتی را برای تأیید یا تغییر ارائه می دهد و سپس مجموعه کار موجود را تجزیه و تحلیل می کند.

دستیار توسعه دهنده جولز

گوگل همچنین یک ابزار توسعه‌دهنده جدید به نام Jules را معرفی کرد، یک دستیار کدنویسی که توسط Gemini 2.0 Flash پشتیبانی می‌شود. جولز در GitHub قرار دارد و می‌تواند کد بنویسد، اشکالات را برطرف کند، و برنامه‌های چند مرحله‌ای را ایجاد و اجرا کند. جولز امروز در دسترس تعداد محدودی از آزمایش کنندگان است. گوگل انتظار دارد در اوایل سال 2025 در دسترس قرار گیرد.

گوگل در حال آماده شدن برای تهدیدات سایبری است

گوگل همچنین خاطرنشان کرد که می‌داند به ویژه پروژه مارینر ممکن است یک شکارگاه غنی برای آن باشد حملات تزریق سریع. این شرکت گفت که در حال کار بر روی نصب نرده های محافظ در برابر آن است تلاش های فیشینگ و کلاهبرداری جایی که مهاجمان ممکن است دستورالعمل های هوش مصنوعی را به ایمیل ها، وب سایت ها یا اسناد مخفی کنند.

منبع: https://www.techrepublic.com/article/google-gemini-two-generative-ai-agent/