گوگل جمینی ۳ معرفی شد: استدلال پیشرفته‌تر برای پاسخ‌ها!

گوگل نسل جدید مدل‌های هوش مصنوعی خود را با نام Gemini 3 معرفی کرده؛ مدلی که هدف آن «زنده کردن هر ایده‌ای» برای کاربر است. از بهبود عمیق در استدلال و درک زمینه تا رابط‌های کاربری مولد (Generative UI)، همه چیز در این نسل تازه به‌سمت تجربه‌ای تعاملی‌تر و هوشمندتر حرکت می‌کند.

جمینی ۳؛ هوشمندترین مدل گوگل تا امروز

پس از Gemini 1.0 با تمرکز بر چندوجهی بودن (متن، تصویر، صوت) و پنجره زمینه طولانی، و سپس Gemini 2.0 و 2.5 با جهش در استدلال و توانایی‌های کدنویسی، حالا نوبت به Gemini 3 رسیده است؛ مدلی که حتی پسوند «.0» را هم کنار گذاشته تا نشان دهد دیگر فقط یک به‌روزرسانی عددی ساده نیست.

گوگل این مدل را «هوشمندترین مدل خود» توصیف می‌کند که می‌تواند به شما کمک کند هر ایده‌ای را از مرحله تصور تا اجرا جلو ببرید. نقطه شروع این جهش، درک عمیق‌تر زمینه و نیت پشت درخواست‌های کاربر است؛ به زبان ساده، نیاز است کمتر توضیح دهید و بیشتر نتیجه بگیرید.

به‌گفته گوگل، Gemini 3 در استدلال به سطحی رسیده که می‌تواند «عمق و ظرافت» را در مسائل پیچیده درک کند؛ از دیدن سرنخ‌های خیلی ریز در یک ایده خلاقانه گرفته تا باز کردن لایه‌های درهم‌تنیده یک مسئله دشوار علمی یا منطقی.

پاسخ‌های کوتاه‌تر، دقیق‌تر و بدون تعارف

نسخه نخست این خانواده، Gemini 3 Pro است که امروز برای اپلیکیشن Gemini و حالت AI Mode عرضه شده. گوگل می‌گوید پاسخ‌های Gemini 3 Pro «هوشمند، مختصر و مستقیم» هستند و به‌جای کلی‌گویی و تعارف، روی ارائه بینش واقعی تمرکز دارند.

این مدل قرار است نه فقط یک ابزار پاسخ‌گو، بلکه مانند یک هم‌فکر دیجیتال عمل کند؛ مدلی که در کنار شما می‌نشیند، اطلاعات را تحلیل می‌کند، راه‌حل‌های جایگزین پیشنهاد می‌دهد و کمک می‌کند هم بهتر بفهمید، هم بهتر بیان کنید. از ترجمه مفاهیم سنگین علمی و تبدیل آن‌ها به کد برای ساخت نمودارهای بصری دقیق، تا طوفان فکری برای ایده‌های خلاقانه، همه در محدوده توان Gemini 3 Pro قرار گرفته است.

اعداد چه می‌گویند؟ نگاهی به بنچمارک‌های Gemini 3 Pro

در دنیای مدل‌های زبانی بزرگ، بنچمارک‌ها یکی از مهم‌ترین معیارهای سنجش هستند. Gemini 3 Pro در LMArena امتیاز 1501 را کسب کرده و از Gemini 2.5 Pro با امتیاز 1451 عبور کرده است؛ مدلی که تا پیش از این صدر جدول را در اختیار داشت.

  • استدلال در سطح دکتری: Gemini 3 Pro در آزمون Humanity’s Last Exam بدون استفاده از ابزار، به امتیاز 37.5٪ رسیده و در GPQA Diamond نیز 91.9٪ کسب کرده است.
  • ریاضیات پیشرفته: در بنچمارک MathArena Apex، این مدل با امتیاز 23.4٪ استاندارد جدیدی برای مدل‌های پیشرو در ریاضی ثبت کرده است.
  • استدلال چندوجهی (متن، تصویر، ویدئو): امتیاز 81٪ در MMMU-Pro و 87.6٪ در Video-MMMU نشان می‌دهد Gemini 3 Pro در فهم ترکیبی متن و تصویر و ویدئو جهش قابل‌توجهی داشته است.
  • دقت factual بهتر: با ثبت امتیاز 72.1٪ در SimpleQA Verified، بهبود جدی در دقت و صحت اطلاعات مشاهده می‌شود.
  • توسعه وب: در WebDev Arena، این مدل با ELO برابر 1487 صدر جدول را در اختیار گرفته است.
  • کار با ترمینال: در Terminal-Bench 2.0 که توانایی استفاده از ابزار ترمینال را می‌سنجد، امتیاز 54.2٪ ثبت شده است.
  • کدنویسی و عامل‌های نرم‌افزاری: در SWE-bench Verified، Gemini 3 Pro با امتیاز 76.2٪ عملکردی بسیار بهتر از 2.5 Pro ارائه می‌دهد؛ بنچمارکی که توان حل مسائل واقعی کدنویسی را می‌سنجد.

ترجمه این اعداد برای کاربر عادی چیست؟ یعنی Gemini 3 Pro می‌تواند مسائل پیچیده علمی، ریاضی و فنی را با اطمینان و پایداری بیشتری حل کند، آن هم در طیف وسیعی از حوزه‌ها.

حالت Deep Think؛ وقتی استدلال به سطح بعدی می‌رود

گوگل در کنار نسخه Pro، از حالت جدیدی به نام Gemini 3 Deep Think هم رونمایی کرده است؛ حالتی که برای استدلال عمیق‌تر و درک بهتر چندوجهی طراحی شده است.

Deep Think در همان آزمون‌های مطرح، از نسخه Pro هم جلوتر می‌رود:

  • Humanity’s Last Exam: امتیاز 41٪ بدون استفاده از ابزار
  • GPQA Diamond: امتیاز 93.8٪
  • ARC-AGI (با اجرای کد): امتیاز بی‌سابقه 45.1٪ که نشان‌دهنده توانایی مدل در حل چالش‌های واقعاً جدید و ناآشناست.

این حالت قرار است طی هفته‌های آینده برای مشترکان AI Ultra فعال شود و بیشتر برای کاربرانی هدف‌گذاری شده که روی مسائل تحقیقاتی، مسائل باز، یا پروژه‌های پیچیده چندمرحله‌ای کار می‌کنند.

رابط‌های مولد (Generative UI)؛ وقتی مدل فقط جواب نمی‌دهد، بلکه تجربه می‌سازد

یکی از جسورانه‌ترین بخش‌های معرفی Gemini 3، مفهوم Generative UI است؛ جایی که مدل نه‌تنها محتوا، بلکه یک رابط کاربری کامل را همزمان تولید می‌کند.

تصور کنید به‌جای اینکه فقط یک متن طولانی از هوش مصنوعی دریافت کنید، برای هر پرسش شما یک صفحه وب، ابزار، بازی یا اپلیکیشن کوچک تعاملی به‌صورت خودکار ساخته شود؛ آن هم متناسب با موضوع و سطح شما.

گوگل این رویکرد را «اولین گام به سمت تجربه‌های کاربری تماماً تولیدشده توسط AI» می‌داند؛ تجربه‌هایی که در آن کاربر دیگر مجبور نیست از میان اپلیکیشن‌های ثابت انتخاب کند، بلکه برای هر نیاز، یک رابط پویا و سفارشی دریافت می‌کند.

چطور این رابط‌های مولد ساخته می‌شوند؟

در پشت‌صحنه، Gemini 3 Pro از ترکیبی از ابزارها و دستورالعمل‌ها استفاده می‌کند:

  • دسترسی به ابزارهای جانبی مثل جست‌وجوی وب و تولید تصویر.
  • استفاده از دستورالعمل‌های سیستمی دقیق که شامل هدف، برنامه‌ریزی، مثال‌ها، مشخصات فنی، فرمت خروجی، راهنمای استفاده از ابزارها و حتی نکات جلوگیری از خطاهای رایج است.
  • ارسال خروجی نهایی به لایه‌های پس‌پردازش برای اصلاح مشکلات احتمالی.

نتیجه این زنجیره، پاسخی است که دیگر فقط یک متن ساده نیست؛ بلکه یک تجربه تعاملی، قابل شخصی‌سازی و از نظر بصری غنی‌تر است.

آزمایش‌های جدید در اپلیکیشن Gemini: از Dynamic View تا Visual Layout

گوگل این قابلیت‌ها را فعلاً به‌صورت آزمایشی در اپلیکیشن Gemini عرضه کرده است. دو تجربه اصلی معرفی‌شده عبارت‌اند از:

Dynamic View؛ پاسخ‌هایی که به‌صورت زنده طراحی می‌شوند

در حالت Dynamic View، Gemini 3 برای هر درخواست شما یک پاسخ تعاملی کاملاً سفارشی طراحی و کدنویسی می‌کند. این یعنی:

  • اگر از مدل بخواهید مفهوم میکروبیوم را برای یک کودک ۵ ساله توضیح دهد، رابطی که می‌سازد از نظر محتوا و امکانات با نسخه‌ای که برای یک متخصص بزرگسال تولید می‌کند کاملاً متفاوت خواهد بود.
  • اگر بخواهید برای یک کسب‌وکار، گالری پست‌های شبکه اجتماعی داشته باشید، رابطی با پیش‌نمایش پست‌ها، قالب‌بندی و شاید ویرایش سریع می‌سازد.
  • اما اگر به دنبال برنامه‌ریزی یک سفر باشید، رابطی با جدول زمان‌بندی، نقشه‌ها و چک‌لیست‌ها تولید می‌کند.

Visual Layout؛ تجربه‌ای شبیه مجله دیجیتال

آزمایش دوم، Visual Layout است؛ نمایی غنی و شبیه یک مجله آنلاین، با عکس‌ها، ماژول‌ها و بلوک‌های محتوایی. تفاوت اصلی آن با Dynamic View در این است که Gemini در این حالت اسلایدرها، چک‌باکس‌ها و فیلترهای مختلف را هم برای تنظیم نتایج اضافه می‌کند.

به‌گفته گوگل، ممکن است در ابتدا تنها یکی از این دو تجربه را در اپلیکیشن ببینید؛ هدف این است که بازخورد کاربران به‌صورت مجزا جمع‌آوری و تحلیل شود.

ورود هم‌زمان به جست‌وجوی گوگل و AI Mode؛ یک مدل، چند تجربه

برای اولین‌بار، یک مدل جدید گوگل به‌طور هم‌زمان در اپلیکیشن Gemini، Google Search و AI Mode ارائه می‌شود. از این هفته، مشترکان AI Pro و AI Ultra می‌توانند در منوی بالای سمت چپ، گزینه Thinking: 3 Pro reasoning and generative layouts را انتخاب کنند.

با Gemini 3، تکنیک query fan-out گوگل می‌تواند جست‌وجوهای بیشتری را در پس‌زمینه اجرا کند؛ جست‌وجوهایی با سوالات ظریف‌تر و دقیق‌تر برای اینکه پاسخ نهایی که به شما می‌رسد، غنی‌تر و قابل‌اعتمادتر باشد.

در AI Mode نیز، مدل می‌تواند رابط‌های مولد بسازد؛ مثلا:

  • یک ماشین‌حساب وام مسکن که اجازه می‌دهد نرخ بهره و مبلغ پیش‌پرداخت را تغییر دهید و سناریوهای مختلف را ببینید.
  • یک شبیه‌ساز فیزیک هنگام یادگیری مفاهیم علمی، تا بتوانید با پارامترها بازی کنید و نتیجه را ببینید.

به‌مرور زمان، Gemini 3 برای تمامی کاربران (رایگان) AI Mode در آمریکا نیز فعال خواهد شد؛ با این تفاوت که مشترکان همچنان از سقف استفاده بالاتر و امکانات پیشرفته‌تر بهره‌مند می‌شوند.

گوگل همچنین اعلام کرده که طی هفته‌های آینده، سیستم انتخاب خودکار مدل در جست‌وجو برای مشترکان، به‌روزرسانی می‌شود تا سؤالات چالشی به Gemini 3 فرستاده شوند و برای کارهای ساده، از مدل‌های سریع‌تر استفاده شود.

Google Antigravity؛ محیط توسعه‌ای که خودِ عامل‌ها کار را انجام می‌دهند

در کنار Gemini 3، گوگل پلتفرم جدیدی به نام Google Antigravity را معرفی کرده است؛ یک محیط توسعه عامل‌محور (agentic) که هدف آن این است که توسعه‌دهندگان بتوانند به‌جای درگیر شدن با جزئیات ریز، روی وظایف سطح بالا تمرکز کنند.

Antigravity در اصل یک IDE هوشمند است که در آن عامل‌ها می‌توانند همزمان در ویرایشگر کد، ترمینال و مرورگر کار انجام دهند. این پلتفرم اکنون برای سیستم‌عامل‌های macOS، ویندوز و لینوکس در دسترس است و از ترکیبی از Gemini 3، قابلیت Computer Use در Gemini 2.5 و Nano Banana بهره می‌برد.

به این ترتیب، عامل‌ها می‌توانند به‌طور خودکار برنامه‌ریزی، اجرا و اعتبارسنجی مجموعه‌ای از وظایف نرم‌افزاری پیچیده را بر عهده بگیرند؛ آن هم هم‌زمان و بدون اینکه توسعه‌دهنده مجبور باشد هر مرحله را دستی کنترل کند. از رفع باگ‌های چندگانه در یک کدبیس بزرگ گرفته تا پیاده‌سازی یک فیچر انتها به انتها، همگی می‌توانند به این عامل‌ها سپرده شوند.

به‌طور کلی، معرفی Gemini 3 و Antigravity نشان می‌دهد گوگل در حال حرکت از مدل‌های صرفاً پاسخ‌گو به سمت سیستم‌های عامل‌محور، تعاملی و مولد تجربه است؛ سیستمی که به‌جای اینکه فقط جواب بدهد، برای هر مسئله، یک فضای کار هوشمند می‌سازد.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

به بالا بروید