» هوش مصنوعی و رباتیک » هوش مصنوعی جمینای ۳.۵ فلش حالا می‌تواند کامپیوتر را کنترل کند
هوش مصنوعی جمینای ۳.۵ فلش حالا می‌تواند کامپیوتر را کنترل کند

هوش مصنوعی جمینای ۳.۵ فلش حالا می‌تواند کامپیوتر را کنترل کند

تیر ۶, ۱۴۰۵ 1010

گوگل با ادغام مستقیم قابلیت کنترل کامپیوتر در هوش مصنوعی جمینای ۳.۵ فلش، به توسعه‌دهندگان اجازه می‌دهد تا ایجنت‌های هوش مصنوعی برای ناوبری در مرورگرها، رابط‌های کاربری موبایل و برنامه‌های دسکتاپ بسازند. این ویژگی که اکنون در مرحله پیش‌نمایش قرار دارد، تحولی بزرگ در اتوماسیون کارهای خسته‌کننده اداری ایجاد می‌کند.

گوگل می‌گوید قابلیت Computer use جمینای ۳.۵ فلش به یک ایجنت هوش مصنوعی امکان می‌دهد تا اسکرین‌شات‌ها را بررسی کند و اقداماتی مانند کلیک ماوس، اسکرول صفحه و تایپ با کیبورد را شبیه به یک انسان انجام دهد.

به گفته گوگل، کاربران می‌توانند از این ویژگی برای کارهایی مانند پرکردن خودکار فرم‌های طولانی، آزمایش نرم‌افزارها، تحقیق در چندین وب‌سایت و اجرای جریان‌های کاری سازمانی استفاده ‌کنند. پیش‌از‌این، گوگل قابلیت کنترل کامپیوتر را در یک مدل مجزای جمینای ۲.۵ ارائه می‌کرد، اما اکنون مهندسان این شرکت آن را درون مدل پایدار جمینای ۳.۵ فلش ادغام کرده‌اند تا نیازی به استفاده از مدل‌های تخصصی نباشد.

کنترل کامپیوتر هوش مصنوعی جمینای ۳.۵ فلش

سپردن کنترل ماوس و کیبورد به هوش مصنوعی نگرانی‌های امنیتی زیادی نیز دارد، اما گوگل برای رفع این مشکل از آموزش‌های تقابلی هدفمند استفاده کرده است تا مدل خود را در برابر حملات تزریق پرامپت محافظت کند. این شرکت دو سیستم ایمنی سازمانی قدرتمند را نیز راه‌اندازی کرده است؛ سیستم اول پیش از انجام هرگونه تغییر حساس یا غیرقابل بازگشت، تأییدیه انسان را درخواست می‌کند. سیستم دوم نیز به محض تشخیص یک حمله احتمالی، وظایف درحال اجرا را فوراً متوقف می‌کند.

هوش مصنوعی جمینای ۳.۵ فلش حالا می‌تواند کامپیوتر را کنترل کند
هوش مصنوعی جمینای ۳.۵ فلش حالا می‌تواند کامپیوتر را کنترل کند

مدل پیشرفته جمینای ۳.۵ فلش که گوگل آن را در ماه مه معرفی کرد، با پشتیبانی از یک میلیون توکن ورودی و ۶۵ هزار توکن خروجی، به رقابت با سایر غول‌های فناوری می‌پردازد. اگرچه گوگل اولین شرکتی نیست که قابلیت کنترل کامپیوتر را ارائه می‌دهد و رقبایی مانند آنتروپیک با هوش مصنوعی Claude و شرکت OpenAI قبلاً در این مسیر گام برداشته‌اند، اما جمینای با ارائه سطوح تفکر قابل تنظیم به توسعه‌دهندگان اجازه می‌دهد تا استدلال بیشتر را با تأخیر و هزینه کمتر مبادله کنند.

به این نوشته امتیاز بدهید!

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

  • ×