افشای Omni؛ پلتفرم یکپارچه گوگل برای تولید تصویر و ویدیو با هوش مصنوعی

براساس تصاویر فاش‌شده از بخش تولید ویدیوی هوش مصنوعی «جمنای»، به نظر می‌رسد گوگل در حال کار روی ابزار جدیدی با نام «Omni» است که می‌تواند تحولی اساسی در تولید محتوای بصری ایجاد کند. این نام در کنار ابزار «توکان» دیده شده که پیش از رویداد Google I/O سال ۱۴۰۴ (۲۰۲۵ میلادی) مشاهده گردید و توسط مدل «وؤ» (Veo) پشتیبانی می‌شود.

در حال حاضر گوگل از رویکردی تفکیک‌شده بهره می‌برد: تولید ویدیو بر عهده مدل Veo 3.1 است، در حالی که تولید تصاویر توسط مدل‌های «نانو بانا پرو» (بر پایه Gemini 3) و «نانو بانا ۲» (بر پایه Gemini 3.1 Flash Image) انجام می‌شود.

آنچه توجه پژوهشگران را جلب کرده، حضور نام Omni در محیط کاربری (نه در کدهای مخفی) است که احتمال تبدیل آن به یک نام تجاری عمومی را افزایش می‌دهد. در حال حاضر هنوز مشخص نیست که Omni صرفاً پوششی برای مدل Veo است، یک مدل مستقل تولید ویدیو محسوب می‌شود، یا گامی به سوی ایجاد سیستمی جامع است که قابلیت مدیریت همزمان تصویر و ویدیو را در یک واحد یکپارچه داشته باشد.

اگر این گمانه‌زنی‌ها درست از آب درآیند، جمنای به نخستین مدل هوش مصنوعی تراز اول تبدیل خواهد شد که قابلیت خروجی ویدیویی دارد. در این صورت، شکاف بین مسیرهای تولید تصویر و ویدیو در گوگل پر می‌شود. این تحول در شرایطی رخ می‌دهد که رقابت در این حوزه بسیار شدید است و ابزاری مانند «سیدنس ۲.۰» (Seedance 2.0) از شرکت بایت‌دنس در بنچمارک‌های تولید ویدیو پیشتاز محسوب می‌شود.

با توجه به برنامه‌ریزی گوگل برای برگزاری رویداد Google I/O در هفته‌های پیش‌رو (سال ۱۴۰۵)، احتمال می‌رود این مراسم میزبان معرفی به‌روزرسانی‌های گسترده جمنای و رونمایی رسمی از ابزارهای جدید تولید ویدیو باشد.

نوشته‌های مرتبط

دیدگاه‌ خود را بنویسید لغو پاسخ