Se você não consegue entender quão bom é o seu produto, você não tem um produto em primeiro lugar. Todo mundo precisa de evals (mesmo que não entendam o que "evals" realmente significa). O principal problema que tive que resolver ao trabalhar com equipes que não conseguem avançar porque seu produto está rodando em círculos: 1. Descobrir a métrica que mais nos importa 2. Automatizar a avaliação do produto 3. Análise de erros para focar nas questões mais críticas e corrigi-las. Eu realmente gostei do post da @sh_reya, e adoro a forma como a pergunta deve ser feita pelas equipes: "Quando podemos nos dar ao luxo de ser menos rigorosos, e quando não podemos?"