یک میز پوکر مجازی، نه مدل زبانی غولپیکر، و پنج روز بازی بیوقفه؛ اینها مواد اولیه یکی از جذابترین آزمایشهای دنیای هوش مصنوعی بود که در نهایت با برتری مدل OpenAI به پایان رسید.
در رقابت PokerBattle.ai، که بهطور کامل توسط هوش مصنوعی اداره میشد، هیچ انسان حرفهای پوکری پشت میز نبود؛ فقط رباتها بودند و تصمیمهایی که ثانیهبهثانیه روی میلیونها احتمال بنا میشد. هر مدل با یک دستور اولیه یکسان وارد بازی شد، بدون کمک بیرونی، بدون تنظیم دستی در میانه راه. همهچیز به استراتژی درونی آنها واگذار شده بود.
مسابقهای که در آن فقط هوش مصنوعی پشت میز نشست
در این تورنمنت، ۹ مدل مطرح دنیای هوش مصنوعی پنج روز پشت میزهای پوکر ماندند: o3 از OpenAI، Claude Sonnet 4.5 از Anthropic، Grok از X.ai، Gemini 2.5 Pro از گوگل، Llama 4 از متا، DeepSeek R1، Kimi K2 از Moonshot AI، Magistral از Mistral AI و GLM 4.6 از Z.AI.
قوانین هم کاملاً جدی بود: پوکر تگزاس هولدم نولیمیت، بلایندهای ۱۰ و ۲۰ دلاری و سرمایه اولیه ۱۰۰ هزار دلاری برای هر «بازیکن». در طول چندین روز، هزاران دست بازی شد؛ دقیقاً شبیه یک تورنمنت بزرگ پوکر، با این تفاوت که اینبار تصمیمها نه روی حس ششم انسان، بلکه روی الگوریتم و احتمالات بنا شده بود.
نتیجه نهایی؟ مدل o3 از OpenAI توانست حدود ۳۶٬۶۹۱ دلار سود کند و عملاً بهعنوان برنده تورنمنت روی کاغذ ثبت شود. خبری از جام و مدال نبود، اما امتیاز مهمتر، اعتبار و «حق پز دادن» در دنیای هوش مصنوعی بود.
o3 از OpenAI؛ دستهای محکم، تصمیمهای حسابشده
در جریان بازیها، o3 خیلی زود نشان داد که میتواند باثباتترین عملکرد را ارائه دهد. این مدل سه تا از پنج پات (pot) بزرگ تورنمنت را به خود اختصاص داد و در فاز پریفلاپ (قبل از رو شدن کارتهای عمومی) رفتاری نزدیک به تئوریهای کلاسیک پوکر از خود نشان داد؛ یعنی چیزی که پوکر بازها به آن «بازی کتابی» میگویند.
در جایگاههای بعدی، Claude از Anthropic و Grok از X.com قرار گرفتند که هر دو توانستند سود قابلتوجهی به دست آورند. سود Claude حدود ۳۳٬۶۴۱ دلار و سود Grok حدود ۲۸٬۷۹۶ دلار گزارش شده است. این سهگانه، عملاً «تاپ تری» میز هوش مصنوعی لقب گرفتند.
در سوی دیگر ماجرا، اوضاع برای برخی مدلها چندان خوب پیش نرفت. Llama 4 از متا عملاً همه استک خود را از دست داد و خیلی زود از جریان اصلی رقابت کنار رفت. Kimi K2 از Moonshot هم افت شدیدی را تجربه کرد و موجودی آن تا حدود ۸۶٬۰۳۰ دلار کاهش یافت. بقیه مدلها از جمله Gemini گوگل و برخی دیگر، عملکردی متوسط تا کمی مثبت داشتند و در میانه جدول ایستادند.
چرا پوکر هنوز هم آزمون طلایی برای هوش مصنوعی است؟
دنیای هوش مصنوعی سالهاست از بازیهایی مثل شطرنج و گو برای نمایش قدرت الگوریتمهای خود استفاده میکند؛ اما پوکر داستانی کاملاً متفاوت دارد. در شطرنج و گو، اطلاعات کامل است: همه مهرهها روی صفحه دیده میشود و چیزی پنهان نیست. اما در پوکر، شما همیشه در حال تصمیمگیری با اطلاعات ناقص هستید.
این همان چیزی است که پوکر را به یکی از بهترین شبیهسازها برای تصمیمگیری در دنیای واقعی تبدیل میکند؛ از مذاکرههای تجاری و مدیریت ریسک در بازارهای مالی گرفته تا استراتژیهای نظامی و حتی طراحی تعاملات در چتباتها. بازیکن – یا در اینجا مدل هوش مصنوعی – باید با کارتهای ناقص، حریفهای ناشناخته و موقعیتهای مبهم، بهترین انتخاب را در کمترین زمان انجام دهد.
تورمنت PokerBattle.ai دقیقاً روی همین نقطه دست گذاشت. این رقابت نشان داد که مدلهای زبانی بزرگ، فقط ماشین تولید متن نیستند؛ بلکه میتوانند در شرایط مبهم، بر پایه احتمالات تصمیم بگیرند و بازی حریف را مدلسازی کنند. آنها در طول بازی، الگوهای رفتاری رقبا را شناسایی کرده و استراتژی خود را در لحظه تنظیم میکردند؛ چیزی که تا چند سال پیش بیشتر شبیه سناریوی علمیتخیلی بود.
جایی که هوش مصنوعی هنوز در پوکر کم میآورد
البته اینطور هم نبود که رباتها بینقص بازی کنند. یکی از مهمترین الگوهایی که از این تورنمنت به چشم آمد، تمایل آنها به بازی بیشازحد تهاجمی بود. بسیاری از مدلها استراتژیهایی را ترجیح میدادند که مملو از بت، رِیز و ریریز بود؛ حتی در موقعیتهایی که یک فولد ساده میتوانست ضرر را متوقف کند.
به بیان ساده، بیشتر این مدلها بیشتر به فکر بردن پاتهای بزرگ بودند تا جلوگیری از باختهای بزرگ. این نوع ریسکپذیری شاید برای یک نمایش هیجانانگیز جذاب باشد، اما از نگاه یک پوکر باز حرفهای همیشه بهترین راهحل نیست.
مسئله مهم دیگر، بلوف بود. برخلاف تصور، رباتها کم بلوف نزدند؛ مشکل اینجا بود که بلوفهایشان اغلب از تحلیل اشتباه موقعیت ناشی میشد، نه از فریب حسابشده. یعنی آنها گاهی در موقعیتهایی بلوف میزدند که پوکر بازان باتجربه میدانند احتمال موفقیتش بسیار پایین است.
این نقاط ضعف، فقط در مورد پوکر معنا ندارند. اشتباه خواندن موقعیت، نتیجهگیری عجولانه بر اساس دادههای ناقص، یا فراموش کردن «پوزیشن» (جایگاه نسبی در میز یا در یک تصمیمگیری) از مشکلاتی است که در دنیای واقعی هم در استفاده از هوش مصنوعی دیده میشود؛ چه در تصمیمهای مالی، چه در پیشنهادهای تجاری و چه در تحلیل ریسک.
فراتر از میز پوکر؛ این آزمایش برای دنیای واقعی چه میگوید؟
اگرچه بعید است روزی سر میز پوکر یک کازینوی واقعی روبهروی یک مدل زبانی بنشینید، اما احتمال اینکه در زندگی روزمره با تصمیمهایی روبهرو شوید که پشت صحنه آنها یک مدل مشابه همینهاست، بسیار زیاد است. از سیستمهای پیشنهاددهنده در پلتفرمهای آنلاین گرفته تا ابزارهای خودکار تصمیمگیری در شرکتها، بانکها و حتی دولتها.
نکته مهمی که PokerBattle.ai به ما یادآوری میکند این است که هوش مصنوعی امروز فقط «چیزی را که خوانده» تکرار نمیکند؛ بلکه در حال یادگیری قضاوت بر پایه احتمالات است، آن هم در شرایط فشار و ابهام. این مدلها کمکم در حال یاد گرفتن «خواندن فضا» هستند؛ تشخیص اینکه چه زمانی حمله کنند، چه زمانی عقب بکشند و چه زمانی فقط صبر کنند.
در عین حال، همین تورنمنت نشان میدهد که حتی قدرتمندترین مدلها هم هنوز از خطا مصون نیستند. آنها همچنان میتوانند موقعیت را بد بفهمند، از دادههای ناقص، نتیجههای نادرست بگیرند یا نسبت به جایگاه واقعی خود در یک فرآیند تصمیمگیری دچار توهم شوند. همانطور که یک بازیکن پوکر میتواند با دست ضعیف، خودش را قهرمان میز تصور کند.
از این زاویه، این تورنمنت پوکر بیش از آنکه یک «شو» برای دنیای تکنولوژی باشد، شبیه یک آینه بود؛ آینهای که نشان میدهد هوش مصنوعی در کجاها به طرز شگفتانگیزی به انسان نزدیک شده و در کجاها هنوز هم نیاز به احتیاط، نظارت انسانی و درک انتقادی داریم.
برای هر کسی که به آینده هوش مصنوعی، چتباتها و مدلهای مولد علاقهمند است، PokerBattle.ai فقط یک بازی نبود؛ یک پیشنمایش از دنیایی بود که در آن الگوریتمها هر روز بیشتر در تصمیمهای مهم ما شریک میشوند – چه روی میز پوکر، چه پشت میز مذاکره.




