Învățarea prin întărire este uimitoare. Și are propriile sale provocări foarte reale legate de cât de puțină informație ajunge înapoi la model, calculul necesar pentru a ajunge acolo. Și, desigur, cu scalare log-liniară sau mai rău.