Представляємо Husky Hold'em Bench – першу операційну систему покерботів eval! Останнім часом ми бачили багато чудових робіт в OS щодо ухилення LLM від стратегічного ігрового процесу. Ось ще один нюанс: модель не може безпосередньо вибирати свої дії, а натомість повинна впроваджувати свою політику на python в умовах обмежень часу та пам'яті, які виключають підходи грубої сили та таблиці пошуку. Потім ми зіштовхуємо ботів один з одним у форматі кругової системи для 6 гравців. Як працюють деякі з провідних моделей міркувань?
292