براساس تصاویر فاششده از بخش تولید ویدیوی هوش مصنوعی «جمنای»، به نظر میرسد گوگل در حال کار روی ابزار جدیدی با نام «Omni» است که میتواند تحولی اساسی در تولید محتوای بصری ایجاد کند. این نام در کنار ابزار «توکان» دیده شده که پیش از رویداد Google I/O سال ۱۴۰۴ (۲۰۲۵ میلادی) مشاهده گردید و توسط مدل «وؤ» (Veo) پشتیبانی میشود.
در حال حاضر گوگل از رویکردی تفکیکشده بهره میبرد: تولید ویدیو بر عهده مدل Veo 3.1 است، در حالی که تولید تصاویر توسط مدلهای «نانو بانا پرو» (بر پایه Gemini 3) و «نانو بانا ۲» (بر پایه Gemini 3.1 Flash Image) انجام میشود.
آنچه توجه پژوهشگران را جلب کرده، حضور نام Omni در محیط کاربری (نه در کدهای مخفی) است که احتمال تبدیل آن به یک نام تجاری عمومی را افزایش میدهد. در حال حاضر هنوز مشخص نیست که Omni صرفاً پوششی برای مدل Veo است، یک مدل مستقل تولید ویدیو محسوب میشود، یا گامی به سوی ایجاد سیستمی جامع است که قابلیت مدیریت همزمان تصویر و ویدیو را در یک واحد یکپارچه داشته باشد.
اگر این گمانهزنیها درست از آب درآیند، جمنای به نخستین مدل هوش مصنوعی تراز اول تبدیل خواهد شد که قابلیت خروجی ویدیویی دارد. در این صورت، شکاف بین مسیرهای تولید تصویر و ویدیو در گوگل پر میشود. این تحول در شرایطی رخ میدهد که رقابت در این حوزه بسیار شدید است و ابزاری مانند «سیدنس ۲.۰» (Seedance 2.0) از شرکت بایتدنس در بنچمارکهای تولید ویدیو پیشتاز محسوب میشود.
با توجه به برنامهریزی گوگل برای برگزاری رویداد Google I/O در هفتههای پیشرو (سال ۱۴۰۵)، احتمال میرود این مراسم میزبان معرفی بهروزرسانیهای گسترده جمنای و رونمایی رسمی از ابزارهای جدید تولید ویدیو باشد.




