چت جی‌پی‌تی در بازی پوکر، تمام مدل‌های هوش مصنوعی را شکست داد!

یک میز پوکر مجازی، نه مدل زبانی غول‌پیکر، و پنج روز بازی بی‌وقفه؛ این‌ها مواد اولیه یکی از جذاب‌ترین آزمایش‌های دنیای هوش مصنوعی بود که در نهایت با برتری مدل OpenAI به پایان رسید.

در رقابت PokerBattle.ai، که به‌طور کامل توسط هوش مصنوعی اداره می‌شد، هیچ انسان حرفه‌ای پوکری پشت میز نبود؛ فقط ربات‌ها بودند و تصمیم‌هایی که ثانیه‌به‌ثانیه روی میلیون‌ها احتمال بنا می‌شد. هر مدل با یک دستور اولیه یکسان وارد بازی شد، بدون کمک بیرونی، بدون تنظیم دستی در میانه راه. همه‌چیز به استراتژی درونی آن‌ها واگذار شده بود.

مسابقه‌ای که در آن فقط هوش مصنوعی پشت میز نشست

در این تورنمنت، ۹ مدل مطرح دنیای هوش مصنوعی پنج روز پشت میزهای پوکر ماندند: o3 از OpenAI، Claude Sonnet 4.5 از Anthropic، Grok از X.ai، Gemini 2.5 Pro از گوگل، Llama 4 از متا، DeepSeek R1، Kimi K2 از Moonshot AI، Magistral از Mistral AI و GLM 4.6 از Z.AI.

قوانین هم کاملاً جدی بود: پوکر تگزاس هولدم نولیمیت، بلایندهای ۱۰ و ۲۰ دلاری و سرمایه اولیه ۱۰۰ هزار دلاری برای هر «بازیکن». در طول چندین روز، هزاران دست بازی شد؛ دقیقاً شبیه یک تورنمنت بزرگ پوکر، با این تفاوت که این‌بار تصمیم‌ها نه روی حس ششم انسان، بلکه روی الگوریتم و احتمالات بنا شده بود.

نتیجه نهایی؟ مدل o3 از OpenAI توانست حدود ۳۶٬۶۹۱ دلار سود کند و عملاً به‌عنوان برنده تورنمنت روی کاغذ ثبت شود. خبری از جام و مدال نبود، اما امتیاز مهم‌تر، اعتبار و «حق پز دادن» در دنیای هوش مصنوعی بود.

o3 از OpenAI؛ دست‌های محکم، تصمیم‌های حساب‌شده

در جریان بازی‌ها، o3 خیلی زود نشان داد که می‌تواند باثبات‌ترین عملکرد را ارائه دهد. این مدل سه تا از پنج پات (pot) بزرگ تورنمنت را به خود اختصاص داد و در فاز پری‌فلاپ (قبل از رو شدن کارت‌های عمومی) رفتاری نزدیک به تئوری‌های کلاسیک پوکر از خود نشان داد؛ یعنی چیزی که پوکر بازها به آن «بازی کتابی» می‌گویند.

در جایگاه‌های بعدی، Claude از Anthropic و Grok از X.com قرار گرفتند که هر دو توانستند سود قابل‌توجهی به دست آورند. سود Claude حدود ۳۳٬۶۴۱ دلار و سود Grok حدود ۲۸٬۷۹۶ دلار گزارش شده است. این سه‌گانه، عملاً «تاپ تری» میز هوش مصنوعی لقب گرفتند.

در سوی دیگر ماجرا، اوضاع برای برخی مدل‌ها چندان خوب پیش نرفت. Llama 4 از متا عملاً همه استک خود را از دست داد و خیلی زود از جریان اصلی رقابت کنار رفت. Kimi K2 از Moonshot هم افت شدیدی را تجربه کرد و موجودی آن تا حدود ۸۶٬۰۳۰ دلار کاهش یافت. بقیه مدل‌ها از جمله Gemini گوگل و برخی دیگر، عملکردی متوسط تا کمی مثبت داشتند و در میانه جدول ایستادند.

چرا پوکر هنوز هم آزمون طلایی برای هوش مصنوعی است؟

دنیای هوش مصنوعی سال‌هاست از بازی‌هایی مثل شطرنج و گو برای نمایش قدرت الگوریتم‌های خود استفاده می‌کند؛ اما پوکر داستانی کاملاً متفاوت دارد. در شطرنج و گو، اطلاعات کامل است: همه مهره‌ها روی صفحه دیده می‌شود و چیزی پنهان نیست. اما در پوکر، شما همیشه در حال تصمیم‌گیری با اطلاعات ناقص هستید.

این همان چیزی است که پوکر را به یکی از بهترین شبیه‌سازها برای تصمیم‌گیری در دنیای واقعی تبدیل می‌کند؛ از مذاکره‌های تجاری و مدیریت ریسک در بازارهای مالی گرفته تا استراتژی‌های نظامی و حتی طراحی تعاملات در چت‌بات‌ها. بازیکن – یا در این‌جا مدل هوش مصنوعی – باید با کارت‌های ناقص، حریف‌های ناشناخته و موقعیت‌های مبهم، بهترین انتخاب را در کمترین زمان انجام دهد.

تورمنت PokerBattle.ai دقیقاً روی همین نقطه دست گذاشت. این رقابت نشان داد که مدل‌های زبانی بزرگ، فقط ماشین تولید متن نیستند؛ بلکه می‌توانند در شرایط مبهم، بر پایه احتمالات تصمیم بگیرند و بازی حریف را مدل‌سازی کنند. آن‌ها در طول بازی، الگوهای رفتاری رقبا را شناسایی کرده و استراتژی خود را در لحظه تنظیم می‌کردند؛ چیزی که تا چند سال پیش بیشتر شبیه سناریوی علمی‌تخیلی بود.

جایی که هوش مصنوعی هنوز در پوکر کم می‌آورد

البته این‌طور هم نبود که ربات‌ها بی‌نقص بازی کنند. یکی از مهم‌ترین الگوهایی که از این تورنمنت به چشم آمد، تمایل آن‌ها به بازی بیش‌ازحد تهاجمی بود. بسیاری از مدل‌ها استراتژی‌هایی را ترجیح می‌دادند که مملو از بت، رِیز و ری‌ریز بود؛ حتی در موقعیت‌هایی که یک فولد ساده می‌توانست ضرر را متوقف کند.

به بیان ساده، بیشتر این مدل‌ها بیشتر به فکر بردن پات‌های بزرگ بودند تا جلوگیری از باخت‌های بزرگ. این نوع ریسک‌پذیری شاید برای یک نمایش هیجان‌انگیز جذاب باشد، اما از نگاه یک پوکر باز حرفه‌ای همیشه بهترین راه‌حل نیست.

مسئله مهم دیگر، بلوف بود. برخلاف تصور، ربات‌ها کم بلوف نزدند؛ مشکل اینجا بود که بلوف‌هایشان اغلب از تحلیل اشتباه موقعیت ناشی می‌شد، نه از فریب حساب‌شده. یعنی آن‌ها گاهی در موقعیت‌هایی بلوف می‌زدند که پوکر بازان باتجربه می‌دانند احتمال موفقیتش بسیار پایین است.

این نقاط ضعف، فقط در مورد پوکر معنا ندارند. اشتباه خواندن موقعیت، نتیجه‌گیری عجولانه بر اساس داده‌های ناقص، یا فراموش کردن «پوزیشن» (جایگاه نسبی در میز یا در یک تصمیم‌گیری) از مشکلاتی است که در دنیای واقعی هم در استفاده از هوش مصنوعی دیده می‌شود؛ چه در تصمیم‌های مالی، چه در پیشنهادهای تجاری و چه در تحلیل ریسک.

فراتر از میز پوکر؛ این آزمایش برای دنیای واقعی چه می‌گوید؟

اگرچه بعید است روزی سر میز پوکر یک کازینوی واقعی روبه‌روی یک مدل زبانی بنشینید، اما احتمال این‌که در زندگی روزمره با تصمیم‌هایی روبه‌رو شوید که پشت صحنه آن‌ها یک مدل مشابه همین‌هاست، بسیار زیاد است. از سیستم‌های پیشنهاددهنده در پلتفرم‌های آنلاین گرفته تا ابزارهای خودکار تصمیم‌گیری در شرکت‌ها، بانک‌ها و حتی دولت‌ها.

نکته مهمی که PokerBattle.ai به ما یادآوری می‌کند این است که هوش مصنوعی امروز فقط «چیزی را که خوانده» تکرار نمی‌کند؛ بلکه در حال یادگیری قضاوت بر پایه احتمالات است، آن هم در شرایط فشار و ابهام. این مدل‌ها کم‌کم در حال یاد گرفتن «خواندن فضا» هستند؛ تشخیص این‌که چه زمانی حمله کنند، چه زمانی عقب بکشند و چه زمانی فقط صبر کنند.

در عین حال، همین تورنمنت نشان می‌دهد که حتی قدرتمندترین مدل‌ها هم هنوز از خطا مصون نیستند. آن‌ها همچنان می‌توانند موقعیت را بد بفهمند، از داده‌های ناقص، نتیجه‌های نادرست بگیرند یا نسبت به جایگاه واقعی خود در یک فرآیند تصمیم‌گیری دچار توهم شوند. همان‌طور که یک بازیکن پوکر می‌تواند با دست ضعیف، خودش را قهرمان میز تصور کند.

از این زاویه، این تورنمنت پوکر بیش از آن‌که یک «شو» برای دنیای تکنولوژی باشد، شبیه یک آینه بود؛ آینه‌ای که نشان می‌دهد هوش مصنوعی در کجاها به طرز شگفت‌انگیزی به انسان نزدیک شده و در کجاها هنوز هم نیاز به احتیاط، نظارت انسانی و درک انتقادی داریم.

برای هر کسی که به آینده هوش مصنوعی، چت‌بات‌ها و مدل‌های مولد علاقه‌مند است، PokerBattle.ai فقط یک بازی نبود؛ یک پیش‌نمایش از دنیایی بود که در آن الگوریتم‌ها هر روز بیشتر در تصمیم‌های مهم ما شریک می‌شوند – چه روی میز پوکر، چه پشت میز مذاکره.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

به بالا بروید