نقدم لكم Husky Hold'em Bench ، أول بوكربوتات نظام التشغيل! لقد رأينا الكثير من العمل الرائع في نظام التشغيل مؤخرا على تقييم LLMs في اللعب الاستراتيجي. إليك واحدة أخرى مع تطور: لا يمكن للنموذج اختيار إجراءاته مباشرة ولكن بدلا من ذلك يتعين عليه تنفيذ سياسته في python في ظل قيود الوقت والذاكرة التي تستبعد مناهج القوة الغاشمة وجداول البحث. ثم نضع الروبوتات ضد بعضها البعض في تنسيق 6 لاعبين من جميع المجموعات المستديرة. كيف تعمل بعض نماذج التفكير الرائدة؟
‏‎275‏