talvez a luta entre evals e sem evals seja apenas sobre quem realmente acredita em RL, e se você pode moldar criativamente as avaliações para refletir melhor as configurações do mundo real.