kanskje evals v no evals-kampen bare handler om hvem som virkelig tror på RL, og om du kreativt kan forme evalueringer for bedre å gjenspeile virkelige oppsett