Ми знаємо офлайн навчання - попереднє навчання, дпо... Дані зрозумілі заздалегідь.
Ми також знаємо онлайн-навчання -- ppo, grpo... Дані будуються під час навчання.
Нове: Humanline training - будь-які дані (офлайн/онлайн), сформовані таким чином, щоб відповідати людському сприйняттю, → можуть дати онлайн-продуктивність за нижчими витратами.