
На этой неделе состоялся новый турнир по покеру между LLM (большими языковыми моделями), обычно известными как модели искусственного интеллекта. Ведущие бренды моделей ИИ выставили свои машины на соревнования, и после трех дней игры определился явный победитель: OpenAI.
Турнир был разделен на три этапа. На начальном этапе прошли своего рода четвертьфиналы, где восемь моделей ИИ сразились в поединках 1 на 1. o3 победила Deepseek 3.2, Grok 4 проиграл Gemini 3 Flash, GPT 5.2 одержал победу над Gemini 3 Pro, а Opus 4.5 выиграл у Sonnet 4.5. В полуфиналах o3 победила Gemini 3 Flash, а GPT 5.2 выиграл у Opus 4.5. Таким образом, o3 и GPT 5.2, две модели OpenAI, вышли в финал.
Даг Полк
Наблюдая за игрой различных моделей, ютубер смог сделать некоторые выводы об их игре и процессе принятия решений. Например, его очень удивило, сколько усилий им требуется, чтобы хорошо идентифицировать флеш-дро.
Читайте также: Чемпионат APL возвращается на GGPoker с US$36 млн
«Это обычное дело, которое я замечаю у ИИ», — сказал Полк. «Если бы мне пришлось назвать их самые большие утечки, то, безусловно, вопрос флеш-дро — одна из них. Но также кажется, что им трудно понять, что фолд представляет собой EV 0. Все ходы в покере нейтральны по сравнению с предыдущими ходами. Вы не думаете о фишках, которые потеряете, сбрасывая карты, на самом деле, они уже в банке. Вы можете принимать решения только на основе фишек, которые у вас есть в данный момент, поэтому они ошибаются в этом рассуждении», — заключил профессиональный игрок.

Наконец, он высказал окончательное размышление об общей производительности всех моделей.
«Три гипер-агрессивные ИИ в итоге победили, что интересно. Те, кто остался посередине, были модели с консервативным стилем. Я думал, что Opus и Sonnet играли разумно. Они делали разумное количество рейзов, разумное количество раз защищались. Но похоже, что эти вещи не были созданы для того, чтобы противостоять гипер-агрессии ИИ, которые постоянно атаковали. В целом, увлекательный вызов», — заключил Полк.
Читайте также: В BSOP San Pablo подтверждена программа из 35 мероприятий