متا با «مانگو» به جنگ مدل‌های تصویری چت‌جی‌پی‌تی می‌رود

متا در حال آماده‌سازی یک مدل هوش مصنوعی تازه با تمرکز جدی روی تصویر و ویدئو است؛ پروژه‌ای با اسم رمز «Mango» که اگر طبق برنامه پیش برود، می‌تواند رقابت در بازار مدل‌های چندوجهی را وارد فاز جدیدی کند. گزارش‌ها می‌گویند این حرکت، بخشی از نقشه متا برای نزدیک‌تر شدن به سطح بازیگرانی مثل گوگل و OpenAI در حوزه تولید و پردازش محتوای بصری است.

براساس اطلاعاتی که وال‌استریت ژورنال منتشر کرده، متا با مانگو می‌خواهد جای پایش را در بازاری محکم کند که با سرعتی عجیب در حال تغییر است؛ بازاری که در آن «فهمیدن» و «ساختن» تصویر و ویدئو، دیگر یک ویژگی جانبی نیست و تبدیل به یکی از اصلی‌ترین معیارهای قدرت مدل‌های AI شده است.

از «آووکادو» تا «مانگو»: تغییر مسیر متا به سمت مدل‌های چندوجهی

متا پیش‌تر روی پروژه‌ای دیگر با اسم رمز «Avocado» کار می‌کرد؛ مدلی بسته (Closed) که تمرکز آن بیشتر روی برنامه‌نویسی و وظایف مرتبط با کدنویسی بود. اما مانگو جهت‌گیری متفاوتی دارد: قابلیت‌های چندوجهی (Multimodal) با محوریت تصویر و ویدئو. این دقیقاً همان جایی است که امروز ابزارهای گوگل و همچنین قابلیت‌های تصویری ChatGPT بیشترین توجه را به خود جلب کرده‌اند.

در عمل، هدف مانگو این است که به مدلی تبدیل شود که بتواند هم محتوای بصری را بفهمد و تحلیل کند، هم آن را تولید و حتی دستکاری کند؛ چیزی شبیه به آنچه کاربران از ابزارهای جدید تولید تصویر و ویدئو انتظار دارند. وقتی یک مدل بتواند از روی یک عکس توضیح دقیق بدهد، نسخه‌های مختلف طراحی پیشنهاد کند یا یک ویدئو کوتاه بسازد، دیگر صرفاً یک «چت‌بات» نیست—یک ابزار تولید محتوا و خلاقیت است.

زمان عرضه و نقش «آزمایشگاه ابرهوش» متا

در گفت‌وگویی که روز پنج‌شنبه ۱۸ام انجام شد، «الکساندر وانگ» مدیر هوش مصنوعی متا و «کریس کاکس» مدیر ارشد محصول این شرکت تأیید کردند که هر دو پروژه مانگو و آووکادو برای عرضه در نیمه اول سال ۲۰۲۶ برنامه‌ریزی شده‌اند.

این دو مدل قرار است از اولین محصولات بزرگ «Meta Superintelligence Labs (MSL)» باشند؛ واحد تحقیق و توسعه‌ای که متا در ماه جولای از آن رونمایی کرد تا فعالیت‌های هوش مصنوعی خود را متمرکزتر و سریع‌تر پیش ببرد. شکل‌گیری MSL نشان می‌دهد متا می‌خواهد به جای پروژه‌های پراکنده، با یک موتور مرکزی به سمت نسل جدید مدل‌ها حرکت کند.

از منظر رقابتی هم پیام روشن است: متا مانگو را برای رقابت مستقیم با محصولات هوش مصنوعی بصری گوگل—مانند Veo 3 و Nano Banana—و همین‌طور قابلیت‌های به‌روز تولید تصویر در ChatGPT آماده می‌کند. در بازاری که هر هفته ویژگی‌های جدید معرفی می‌شود، تأخیر چندماهه هم می‌تواند هزینه‌ساز باشد؛ به همین دلیل «زمان‌بندی» به اندازه «توانایی» مهم شده است.

چرا متا روی AI شرط می‌بندد و متاورس را عقب می‌کشد؟

این خبر فقط درباره یک مدل جدید نیست؛ درباره تغییر اولویت‌های شرکتی هم هست. گزارش‌ها می‌گویند متا قصد دارد سرمایه‌گذاری‌های مرتبط با متاورس را کاهش دهد و منابع بیشتری را به توسعه هوش مصنوعی اختصاص دهد. دلیلش هم قابل حدس است: مدل‌های چندوجهی پیشرفته، فرصت رشد فوری‌تر و اثرگذاری ملموس‌تری دارند—از ابزارهای تولید محتوا و تبلیغات گرفته تا کمک به سازندگان، کسب‌وکارها و حتی تجربه‌های جدید در شبکه‌های اجتماعی.

در نهایت، مانگو اگر موفق شود، می‌تواند متا را از یک بازیگر مهم در پلتفرم‌های اجتماعی، به یک رقیب جدی‌تر در لایه زیرساختی هوش مصنوعی تبدیل کند؛ جایی که آینده محصولات دیجیتال—از ویدئوی کوتاه تا دستیارهای هوشمند—به آن گره خورده است.

از «آووکادو» تا «مانگو»: تغییر مسیر متا به سمت مدل‌های چندوجهی

زمان عرضه و نقش «آزمایشگاه ابرهوش» متا

چرا متا روی AI شرط می‌بندد و متاورس را عقب می‌کشد؟

نوشته‌های مرتبط

دیدگاه‌ خود را بنویسید لغو پاسخ