最初の OS ポーカーボット エバリエーションである Husky Hold'em Bench をご紹介します! 最近、戦略的なゲームプレイに関する LLM の評価に関する OS の素晴らしい研究が数多く見られました。 もうひねりを加えたもう一つ、モデルはアクションを直接選択するのではなく、ブルートフォースアプローチやルックアップテーブルを除外する時間とメモリの制約の下でPythonでポリシーを実装する必要があります。 次に、ボットを 6 人のプレイヤー オール コンボ ラウンドロビン形式で互いに対戦させます。主要な推論モデルのいくつかはどのように機能しますか?
59.28K