Vi kjenner offline trening - pretraining, dpo ... Data er klare på forhånd.
Vi kjenner også nettbasert opplæring - ppo, grpo... Data bygges under opplæring.
Nytt: Humanline-trening -- alle data (offline/online) formet for å matche menneskelig oppfatning → kan gi online ytelse til lavere kostnad