Обучение с подкреплением удивительно. И у него есть свои реальные проблемы с тем, как мало информации возвращается в модель, с вычислительными ресурсами, необходимыми для достижения этого. И, конечно, с логарифмическим линейным масштабированием или хуже.