رونمایی گوگل از خانواده هوش مصنوعی Gemini Omni: مدلهایی که همهچیز میسازند
گوگل امشب در کنفرانس توسعهدهندگان خود موسوم به I/O از خانواده مدلهای هوش مصنوعی جدیدی بهنام Gemini Omni پرده برداشت. این مدلها که در ابتدا قابلیت تولید ویدیو دارند، از تخصص گوگل در زمینه مدلهای جهانی (World Models) استفاده میکنند و عملکرد خیرهکنندهای دارند.
معرفی مدل هوش مصنوعی Gemini Omni
مدل هوش مصنوعی جمینای Omni میتواند هر چیزی از روی پرامپت کاربران خلق کند. این مدل چندوجهی است و میتواند با انواع مختلف ورودی ازجمله، تصویر، صدا و ویدیو کار کند. برای نمونه میتوانید نقاشی یک ماهی را بکشید و از مدل بخواهید یک ماهی واقعی را درون دریا نشان دهد. مدل Omni امکان ویرایش محاورهای را فراهم میکند تا بتوانید عناصر مختلف ویدیو مثل شخصیت داخل آن، پسزمینه یا دیگر ویژگیها را با صدای خود تغییر دهید.

برای مثال میتوانید در یک پرامپت از جمینای آمنی بخواهید حتی زاویه دید دوربین را تغییر دهد یا استایل درون ویدیو را عوض کند، بدون اینکه اشیای درون ویدیو تغییر کند. همچنین اگر انسان در ویدیو حضور داشته باشد، چهره او تغییر نخواهد کرد، اما میتوانید هر چیزی از جمله لباس و محیط اطراف او را تغییر دهید.

گوگل میگوید مدل Gemini Omni فهم شهودی خود از فیزیک را با دانش جمینای از جهان واقعی ترکیب میکند. با این مدل حالا داستانها و خروجیها فقط واقعگرایانه نیستند، بلکه شبیه دنیای واقعی عمل میکنند. آمنی اکنون درک بهتری از نیروهای فیزیکی مثل گرانش، انرژی جنبشی و دینامیک مایعات دارد.
اولین مدلی که از خانواده مدلهای جمینای آمنی منتشر میشود، Gemini Omni Flash نام دارد. این مدل از امروز در اپ جمینای برای کاربران اشتراکهای Google AI Plus و همچنین AI Pro و AI Ultra در سراسر جهان در دسترس قرار میگیرد. در ادامه هفته نیز کاربران بخش یوتوب Shorts و اپ YouTube Create به آن دسترسی پیدا میکنند.
