Esittelyssä Husky Hold'em Bench, ensimmäinen OS pokerbots eval! Olemme nähneet viime aikoina paljon hienoa työtä käyttöjärjestelmässä LLM:ien välttämisessä strategisessa pelattavuudessa. Tässä on toinen, jossa on käänne: malli ei saa valita toimintojaan suoraan, vaan sen sijaan sen on toteutettava käytäntönsä pythonissa aika- ja muistirajoitusten alaisena, jotka sulkevat pois raa'an voiman lähestymistavat ja hakutaulukot. Sitten asetamme botit toisiaan vastaan 6 pelaajan yhdistelmän round robin -muodossa. Miten jotkut johtavista päättelymalleista toimivat?
58,43K