خبر " رونمایی گوگل از خانواده هوش مصنوعی Gemini Omni: مدل‌هایی که همه‌‌چیز می‌سازند "

رونمایی گوگل از خانواده هوش مصنوعی Gemini Omni: مدل‌هایی که همه‌‌چیز می‌سازند

دیجیاتو digiato اردیبهشت ۳۰, ۱۴۰۵ 105

گوگل امشب در کنفرانس توسعه‌دهندگان خود موسوم به I/O از خانواده مدل‌های هوش مصنوعی جدیدی به‌نام Gemini Omni پرده برداشت. این مدل‌ها که در ابتدا قابلیت تولید ویدیو دارند، از تخصص گوگل در زمینه مدل‌های جهانی (World Models) استفاده می‌کنند و عملکرد خیره‌کننده‌ای دارند.

معرفی مدل هوش مصنوعی Gemini Omni

مدل هوش مصنوعی جمینای Omni می‌تواند هر چیزی از روی پرامپت کاربران خلق کند. این مدل چندوجهی است و می‌تواند با انواع مختلف ورودی ازجمله، تصویر، صدا و ویدیو کار کند. برای نمونه می‌توانید نقاشی یک ماهی را بکشید و از مدل بخواهید یک ماهی واقعی را درون دریا نشان دهد. مدل Omni امکان ویرایش محاوره‌ای را فراهم می‌کند تا بتوانید عناصر مختلف ویدیو مثل شخصیت داخل آن، پس‌زمینه یا دیگر ویژگی‌ها را با صدای خود تغییر دهید.

گوگل Gemini Omni — رونمایی گوگل از خانواده هوش مصنوعی Gemini Omni: مدل‌هایی که همه‌‌چیز می‌سازند

برای مثال می‌توانید در یک پرامپت از جمینای آمنی بخواهید حتی زاویه دید دوربین را تغییر دهد یا استایل درون ویدیو را عوض کند، بدون اینکه اشیای درون ویدیو تغییر کند. همچنین اگر انسان در ویدیو حضور داشته باشد، چهره او تغییر نخواهد کرد، اما می‌توانید هر چیزی از جمله لباس و محیط اطراف او را تغییر دهید.

گوگل می‌گوید مدل Gemini Omni فهم شهودی خود از فیزیک را با دانش جمینای از جهان واقعی ترکیب می‌کند. با این مدل حالا داستان‌ها و خروجی‌ها فقط واقع‌گرایانه نیستند، بلکه شبیه دنیای واقعی عمل می‌کنند. آمنی اکنون درک بهتری از نیروهای فیزیکی مثل گرانش، انرژی جنبشی و دینامیک مایعات دارد.

اولین مدلی که از خانواده مدل‌های جمینای آمنی منتشر می‌شود، Gemini Omni Flash نام دارد. این مدل از امروز در اپ جمینای برای کاربران اشتراک‌های Google AI Plus و همچنین AI Pro و AI Ultra در سراسر جهان در دسترس قرار می‌گیرد. در ادامه هفته نیز کاربران بخش یوتوب Shorts و اپ YouTube Create به آن دسترسی پیدا می‌کنند.