OpenAI با یک مدل جدید از تولید تصویر وارد می‌شود!

اوپن‌ای‌آی دوباره سرعت گرفته است؛ این‌بار با نسخه تازه‌ای از «ChatGPT Images» که قرار است تولید تصویر را هم سریع‌تر کند و هم قابل‌اعتمادتر. اگر تا امروز هنگام درخواست یک تغییر کوچک—مثلاً «نور را کمی سردتر کن»—با بازسازی کامل تصویر و از بین رفتن شباهت چهره روبه‌رو شده‌اید، احتمالاً این آپدیت دقیقاً برای شما ساخته شده است.

نسخه جدید با نام GPT-Image-1.5 از سه‌شنبه برای همه کاربران ChatGPT در دسترس قرار می‌گیرد و هم‌زمان از طریق API هم ارائه می‌شود. اوپن‌ای‌آی می‌گوید این مدل «پیروی از دستور» را بهتر انجام می‌دهد، ویرایش‌ها دقیق‌تر شده‌اند و سرعت تولید تصویر می‌تواند تا ۴ برابر افزایش پیدا کند.

رقابت داغ با گوگل؛ «کد قرمز» هنوز ادامه دارد

این رونمایی را باید بخشی از تشدید رقابت اوپن‌ای‌آی با گوگل دانست؛ رقابتی که بعد از انتشار یک یادداشت داخلی لو رفته از «سم آلتمن» (مدیرعامل اوپن‌ای‌آی) رنگ و بوی «کد قرمز» گرفت. طبق همان گزارش‌ها، اوپن‌ای‌آی به‌دنبال بازپس‌گیری جایگاه رهبری بازار هوش مصنوعی است؛ درست در زمانی که گوگل با عرضه مدل پرچم‌دار Gemini 3 و همچنین ابزار تولید تصویر وایرال خود یعنی Nano Banana Pro توانست در چندین بنچمارک، از جمله رده‌بندی‌های LMArena، عملکردی چشم‌گیر ثبت کند.

حتی پس از آن‌که اوپن‌ای‌آی هفته گذشته با معرفی GPT-5.2 تلاش کرد پاسخ محکمی برای کاربران حرفه‌ای و توسعه‌دهندگان داشته باشد، گزارش‌ها نشان می‌دهد گوگل همچنان در برخی شاخص‌ها جلوتر است. جالب اینکه گفته می‌شود اوپن‌ای‌آی از قبل قصد داشت یک تصویرساز جدید را اوایل ژانویه منتشر کند، اما حالا با این اعلامیه، برنامه‌ها را جلو انداخته است. آخرین عرضه رسمی مدل تصویر این شرکت GPT-Image-1 در ماه آوریل بود.

ویرایش‌هایی که تصویر را از نو نمی‌سازند

GPT-Image-1.5 در زمانی معرفی می‌شود که ابزارهای تولید تصویر و ویدئو دیگر صرفاً نمونه‌های آزمایشی نیستند و کم‌کم به قابلیت‌های «آماده برای تولید» نزدیک می‌شوند. یکی از مهم‌ترین وعده‌ها در این نسخه، کنترل دقیق‌ترِ ویرایش‌های پساتولید است؛ چیزی که برای حفظ یکپارچگی بصری حیاتی است.

در عمل یعنی چه؟ یعنی وقتی از مدل می‌خواهید فقط «حالت چهره را کمی تغییر بده» یا «ترکیب‌بندی را دست نزن، فقط نور را اصلاح کن»، احتمالاً دیگر مجبور نیستید با نسخه‌ای کاملاً متفاوت از تصویر قبلی کنار بیایید. اوپن‌ای‌آی می‌خواهد کنترل‌های جزئی‌تری در اختیار کاربر بگذارد تا مواردی مثل شباهت چهره، نورپردازی، کادر و تون رنگ در چند مرحله ویرایش ثابت بماند—چالشی که خیلی از ابزارهای GenAI هنوز در آن ضعیف‌اند.

ChatGPT Images شبیه یک استودیوی خلاق می‌شود

به‌روزرسانی فقط به موتور تولید تصویر محدود نیست. «فیدی سیمو» مدیرعامل بخش اپلیکیشن‌های اوپن‌ای‌آی، در پست وبلاگی خود نوشته که از این پس «Images» یک ورودی اختصاصی در سایدبار ChatGPT خواهد داشت و تجربه‌ای شبیه استودیوی خلاقیت ارائه می‌دهد.

به گفته او، صفحه‌های جدید مشاهده و ویرایش تصویر کمک می‌کنند خروجی به چیزی که در ذهن دارید نزدیک‌تر شود؛ یا حتی اگر ایده ندارید، از پرامپت‌های ترند و فیلترهای از پیش‌تنظیم‌شده الهام بگیرید. این تغییر کوچک به‌نظر می‌رسد، اما برای کسانی که هر روز با تولید محتوا، طراحی کمپین یا ساخت دارایی‌های بصری محصول سروکار دارند، می‌تواند زمان زیادی ذخیره کند.

اوپن‌ای‌آی هم‌زمان روی «بصری‌تر کردن» تجربه کلی ChatGPT هم کار می‌کند: از نمایش نتایج جست‌وجو با عناصر تصویری و منابع شفاف گرفته تا کمک در کارهای روزمره مثل تبدیل واحدها یا چک کردن نتیجه مسابقات. ایده اصلی ساده است: وقتی تصویر بهتر از کلمه داستان را تعریف می‌کند، چرا ChatGPT از آن استفاده نکند؟

  • دسترسی: برای همه کاربران ChatGPT + ارائه از طریق API
  • بهبودها: پیروی بهتر از دستور، ویرایش دقیق‌تر، سرعت تا ۴ برابر
  • تمرکز کلیدی: حفظ یکپارچگی بصری در تکرار و ویرایش‌های مرحله‌ای

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

به بالا بروید