- Generalisering är bara en algoritm. - (Feedback) Transformers kan lära sig vilken algoritm som helst genom GD. Huvudfråga: På vilken träningsdata? Min uppfattning: När man tränar transformers med RL på korrekt utvalda problem kommer generaliseringsförmåga att framträda och förbättras avsevärt.