Подразделение Facebook, занимающееся разработкой искусственного интеллекта, на днях опубликовало доклад о создании и успешном тестировании нового покерного бота ReBeL. Разработчики заявили, что его алгоритмы мощнее и эффективнее чем у Libratus – единственного бота, который смог обыграть ПРО-покеристов.
В 2019 году одно из подразделений Фэйсбук уже наделало много шума, выпустив бота Pluribus, который по факту оказался просто еще одним шагом в развитии ИИ, но никак не "убийцей покера", способным играть в плюс не только HU, но и 6-макс против сильных соперников.
На этот раз, правда, никаких громких заявлений о влиянии бота на покерную индустрию и его революционных возможностях не было. Также, как и записей видео игры против реальных оппонентов. Компания Rebel AI ограничилась 27-страничным отчетом с описанием общих принципов работы своего бота и его сравнением с программами предыдущего поколения.
Название бота представляет собой аббревиатуру фразы "Recursive Belief-based Learning", то есть упор в нем сделан на возможность самообучения в условиях ограниченной информации. Это подтверждает и название отчета от трех разработчиков (Ноума Брауна, Антона Бахтина и Адама Гуна) – "Комбинация глубокого обучения и подкрепленного поиска для игр с неполной информацией".
Создан ReBeL на основе бота DeepStack, который первым в 2017 году обыграл в покер человека. Его главное отличие от всех предыдущих разработок в этой сфере заключается в использовании так называемого «Public Belief States» (PBS).
PBS – это новый механизм самообучения бота, который включает в себя не только анализ непосредственной информации об игре, но и ведет учет мнения соперника о его положении в процессе розыгрыша.
То есть ReBeL уже не только анализирует саму раздачу, но и то, как ее может оценивать его оппонент, как это делают все успешные живые игроки.
ReBeL, по сравнению со всеми своими предшественниками, работает быстрее: на розыгрыш он тратит минимум на 2 секунды меньше, чем Libratus, и для принятия решения ему требуется не более 5 секунд.
Единственный игрок в покер, против которого он сыграл, был Донг Ким (именно он меньше всего проиграл Либратусу).
На дистанции в 7,500 раздач программа выигрыв ала у человека 0,165ББ за одну руку, тогда как Libratus имел показатель в 0,147ББ.
Понятно, что для более реальной оценки возможностей ReBeL нужен полноценный тест против целой группы сильных покеристов. Особенно, для понимания реального уровня работы PBS.
Разработчики бота сразу заявили, что их целью не являются какие-то достижения их детища в сфере покера. Он должен помочь людям в организации сложных систем с неполной информацией, например, транспортной логистики, аукционов, кибербезопасности. Также они не намерены обнародовать его код.
А для успокоения игроков в покер можем сказать, что:
Поэтому в современной борьбе игроков и аффилейтов против проявлений нечестной игры в покер-румах ReBeL никак не сможет быть на стороне ботоводов.
Об онлайн-покере «внешний мир» обычно узнает, только когда в нем происходят какие-то особо громки...
Борьба между ботоводами и покер-румами по большей части проходит в «подковерном» формате и до игр...
Нечестная игра в онлайн-покере является одной из самых главных проблем, отрицательно влияющих на ...
Тема ботов и вспомогательного софта этой весной доминирует над всеми другими покерными новостями....