گوگل نسل جدید مدلهای هوش مصنوعی خود را با نام Gemini 3 معرفی کرده؛ مدلی که هدف آن «زنده کردن هر ایدهای» برای کاربر است. از بهبود عمیق در استدلال و درک زمینه تا رابطهای کاربری مولد (Generative UI)، همه چیز در این نسل تازه بهسمت تجربهای تعاملیتر و هوشمندتر حرکت میکند.
جمینی ۳؛ هوشمندترین مدل گوگل تا امروز
پس از Gemini 1.0 با تمرکز بر چندوجهی بودن (متن، تصویر، صوت) و پنجره زمینه طولانی، و سپس Gemini 2.0 و 2.5 با جهش در استدلال و تواناییهای کدنویسی، حالا نوبت به Gemini 3 رسیده است؛ مدلی که حتی پسوند «.0» را هم کنار گذاشته تا نشان دهد دیگر فقط یک بهروزرسانی عددی ساده نیست.
گوگل این مدل را «هوشمندترین مدل خود» توصیف میکند که میتواند به شما کمک کند هر ایدهای را از مرحله تصور تا اجرا جلو ببرید. نقطه شروع این جهش، درک عمیقتر زمینه و نیت پشت درخواستهای کاربر است؛ به زبان ساده، نیاز است کمتر توضیح دهید و بیشتر نتیجه بگیرید.
بهگفته گوگل، Gemini 3 در استدلال به سطحی رسیده که میتواند «عمق و ظرافت» را در مسائل پیچیده درک کند؛ از دیدن سرنخهای خیلی ریز در یک ایده خلاقانه گرفته تا باز کردن لایههای درهمتنیده یک مسئله دشوار علمی یا منطقی.
پاسخهای کوتاهتر، دقیقتر و بدون تعارف
نسخه نخست این خانواده، Gemini 3 Pro است که امروز برای اپلیکیشن Gemini و حالت AI Mode عرضه شده. گوگل میگوید پاسخهای Gemini 3 Pro «هوشمند، مختصر و مستقیم» هستند و بهجای کلیگویی و تعارف، روی ارائه بینش واقعی تمرکز دارند.
این مدل قرار است نه فقط یک ابزار پاسخگو، بلکه مانند یک همفکر دیجیتال عمل کند؛ مدلی که در کنار شما مینشیند، اطلاعات را تحلیل میکند، راهحلهای جایگزین پیشنهاد میدهد و کمک میکند هم بهتر بفهمید، هم بهتر بیان کنید. از ترجمه مفاهیم سنگین علمی و تبدیل آنها به کد برای ساخت نمودارهای بصری دقیق، تا طوفان فکری برای ایدههای خلاقانه، همه در محدوده توان Gemini 3 Pro قرار گرفته است.
اعداد چه میگویند؟ نگاهی به بنچمارکهای Gemini 3 Pro
در دنیای مدلهای زبانی بزرگ، بنچمارکها یکی از مهمترین معیارهای سنجش هستند. Gemini 3 Pro در LMArena امتیاز 1501 را کسب کرده و از Gemini 2.5 Pro با امتیاز 1451 عبور کرده است؛ مدلی که تا پیش از این صدر جدول را در اختیار داشت.
- استدلال در سطح دکتری: Gemini 3 Pro در آزمون Humanity’s Last Exam بدون استفاده از ابزار، به امتیاز 37.5٪ رسیده و در GPQA Diamond نیز 91.9٪ کسب کرده است.
- ریاضیات پیشرفته: در بنچمارک MathArena Apex، این مدل با امتیاز 23.4٪ استاندارد جدیدی برای مدلهای پیشرو در ریاضی ثبت کرده است.
- استدلال چندوجهی (متن، تصویر، ویدئو): امتیاز 81٪ در MMMU-Pro و 87.6٪ در Video-MMMU نشان میدهد Gemini 3 Pro در فهم ترکیبی متن و تصویر و ویدئو جهش قابلتوجهی داشته است.
- دقت factual بهتر: با ثبت امتیاز 72.1٪ در SimpleQA Verified، بهبود جدی در دقت و صحت اطلاعات مشاهده میشود.
- توسعه وب: در WebDev Arena، این مدل با ELO برابر 1487 صدر جدول را در اختیار گرفته است.
- کار با ترمینال: در Terminal-Bench 2.0 که توانایی استفاده از ابزار ترمینال را میسنجد، امتیاز 54.2٪ ثبت شده است.
- کدنویسی و عاملهای نرمافزاری: در SWE-bench Verified، Gemini 3 Pro با امتیاز 76.2٪ عملکردی بسیار بهتر از 2.5 Pro ارائه میدهد؛ بنچمارکی که توان حل مسائل واقعی کدنویسی را میسنجد.
ترجمه این اعداد برای کاربر عادی چیست؟ یعنی Gemini 3 Pro میتواند مسائل پیچیده علمی، ریاضی و فنی را با اطمینان و پایداری بیشتری حل کند، آن هم در طیف وسیعی از حوزهها.
حالت Deep Think؛ وقتی استدلال به سطح بعدی میرود
گوگل در کنار نسخه Pro، از حالت جدیدی به نام Gemini 3 Deep Think هم رونمایی کرده است؛ حالتی که برای استدلال عمیقتر و درک بهتر چندوجهی طراحی شده است.
Deep Think در همان آزمونهای مطرح، از نسخه Pro هم جلوتر میرود:
- Humanity’s Last Exam: امتیاز 41٪ بدون استفاده از ابزار
- GPQA Diamond: امتیاز 93.8٪
- ARC-AGI (با اجرای کد): امتیاز بیسابقه 45.1٪ که نشاندهنده توانایی مدل در حل چالشهای واقعاً جدید و ناآشناست.
این حالت قرار است طی هفتههای آینده برای مشترکان AI Ultra فعال شود و بیشتر برای کاربرانی هدفگذاری شده که روی مسائل تحقیقاتی، مسائل باز، یا پروژههای پیچیده چندمرحلهای کار میکنند.
رابطهای مولد (Generative UI)؛ وقتی مدل فقط جواب نمیدهد، بلکه تجربه میسازد
یکی از جسورانهترین بخشهای معرفی Gemini 3، مفهوم Generative UI است؛ جایی که مدل نهتنها محتوا، بلکه یک رابط کاربری کامل را همزمان تولید میکند.
تصور کنید بهجای اینکه فقط یک متن طولانی از هوش مصنوعی دریافت کنید، برای هر پرسش شما یک صفحه وب، ابزار، بازی یا اپلیکیشن کوچک تعاملی بهصورت خودکار ساخته شود؛ آن هم متناسب با موضوع و سطح شما.
گوگل این رویکرد را «اولین گام به سمت تجربههای کاربری تماماً تولیدشده توسط AI» میداند؛ تجربههایی که در آن کاربر دیگر مجبور نیست از میان اپلیکیشنهای ثابت انتخاب کند، بلکه برای هر نیاز، یک رابط پویا و سفارشی دریافت میکند.
چطور این رابطهای مولد ساخته میشوند؟
در پشتصحنه، Gemini 3 Pro از ترکیبی از ابزارها و دستورالعملها استفاده میکند:
- دسترسی به ابزارهای جانبی مثل جستوجوی وب و تولید تصویر.
- استفاده از دستورالعملهای سیستمی دقیق که شامل هدف، برنامهریزی، مثالها، مشخصات فنی، فرمت خروجی، راهنمای استفاده از ابزارها و حتی نکات جلوگیری از خطاهای رایج است.
- ارسال خروجی نهایی به لایههای پسپردازش برای اصلاح مشکلات احتمالی.
نتیجه این زنجیره، پاسخی است که دیگر فقط یک متن ساده نیست؛ بلکه یک تجربه تعاملی، قابل شخصیسازی و از نظر بصری غنیتر است.
آزمایشهای جدید در اپلیکیشن Gemini: از Dynamic View تا Visual Layout
گوگل این قابلیتها را فعلاً بهصورت آزمایشی در اپلیکیشن Gemini عرضه کرده است. دو تجربه اصلی معرفیشده عبارتاند از:
Dynamic View؛ پاسخهایی که بهصورت زنده طراحی میشوند
در حالت Dynamic View، Gemini 3 برای هر درخواست شما یک پاسخ تعاملی کاملاً سفارشی طراحی و کدنویسی میکند. این یعنی:
- اگر از مدل بخواهید مفهوم میکروبیوم را برای یک کودک ۵ ساله توضیح دهد، رابطی که میسازد از نظر محتوا و امکانات با نسخهای که برای یک متخصص بزرگسال تولید میکند کاملاً متفاوت خواهد بود.
- اگر بخواهید برای یک کسبوکار، گالری پستهای شبکه اجتماعی داشته باشید، رابطی با پیشنمایش پستها، قالببندی و شاید ویرایش سریع میسازد.
- اما اگر به دنبال برنامهریزی یک سفر باشید، رابطی با جدول زمانبندی، نقشهها و چکلیستها تولید میکند.
Visual Layout؛ تجربهای شبیه مجله دیجیتال
آزمایش دوم، Visual Layout است؛ نمایی غنی و شبیه یک مجله آنلاین، با عکسها، ماژولها و بلوکهای محتوایی. تفاوت اصلی آن با Dynamic View در این است که Gemini در این حالت اسلایدرها، چکباکسها و فیلترهای مختلف را هم برای تنظیم نتایج اضافه میکند.
بهگفته گوگل، ممکن است در ابتدا تنها یکی از این دو تجربه را در اپلیکیشن ببینید؛ هدف این است که بازخورد کاربران بهصورت مجزا جمعآوری و تحلیل شود.
ورود همزمان به جستوجوی گوگل و AI Mode؛ یک مدل، چند تجربه
برای اولینبار، یک مدل جدید گوگل بهطور همزمان در اپلیکیشن Gemini، Google Search و AI Mode ارائه میشود. از این هفته، مشترکان AI Pro و AI Ultra میتوانند در منوی بالای سمت چپ، گزینه Thinking: 3 Pro reasoning and generative layouts را انتخاب کنند.
با Gemini 3، تکنیک query fan-out گوگل میتواند جستوجوهای بیشتری را در پسزمینه اجرا کند؛ جستوجوهایی با سوالات ظریفتر و دقیقتر برای اینکه پاسخ نهایی که به شما میرسد، غنیتر و قابلاعتمادتر باشد.
در AI Mode نیز، مدل میتواند رابطهای مولد بسازد؛ مثلا:
- یک ماشینحساب وام مسکن که اجازه میدهد نرخ بهره و مبلغ پیشپرداخت را تغییر دهید و سناریوهای مختلف را ببینید.
- یک شبیهساز فیزیک هنگام یادگیری مفاهیم علمی، تا بتوانید با پارامترها بازی کنید و نتیجه را ببینید.
بهمرور زمان، Gemini 3 برای تمامی کاربران (رایگان) AI Mode در آمریکا نیز فعال خواهد شد؛ با این تفاوت که مشترکان همچنان از سقف استفاده بالاتر و امکانات پیشرفتهتر بهرهمند میشوند.
گوگل همچنین اعلام کرده که طی هفتههای آینده، سیستم انتخاب خودکار مدل در جستوجو برای مشترکان، بهروزرسانی میشود تا سؤالات چالشی به Gemini 3 فرستاده شوند و برای کارهای ساده، از مدلهای سریعتر استفاده شود.
Google Antigravity؛ محیط توسعهای که خودِ عاملها کار را انجام میدهند
در کنار Gemini 3، گوگل پلتفرم جدیدی به نام Google Antigravity را معرفی کرده است؛ یک محیط توسعه عاملمحور (agentic) که هدف آن این است که توسعهدهندگان بتوانند بهجای درگیر شدن با جزئیات ریز، روی وظایف سطح بالا تمرکز کنند.
Antigravity در اصل یک IDE هوشمند است که در آن عاملها میتوانند همزمان در ویرایشگر کد، ترمینال و مرورگر کار انجام دهند. این پلتفرم اکنون برای سیستمعاملهای macOS، ویندوز و لینوکس در دسترس است و از ترکیبی از Gemini 3، قابلیت Computer Use در Gemini 2.5 و Nano Banana بهره میبرد.
به این ترتیب، عاملها میتوانند بهطور خودکار برنامهریزی، اجرا و اعتبارسنجی مجموعهای از وظایف نرمافزاری پیچیده را بر عهده بگیرند؛ آن هم همزمان و بدون اینکه توسعهدهنده مجبور باشد هر مرحله را دستی کنترل کند. از رفع باگهای چندگانه در یک کدبیس بزرگ گرفته تا پیادهسازی یک فیچر انتها به انتها، همگی میتوانند به این عاملها سپرده شوند.
بهطور کلی، معرفی Gemini 3 و Antigravity نشان میدهد گوگل در حال حرکت از مدلهای صرفاً پاسخگو به سمت سیستمهای عاملمحور، تعاملی و مولد تجربه است؛ سیستمی که بهجای اینکه فقط جواب بدهد، برای هر مسئله، یک فضای کار هوشمند میسازد.

