Deepseek-Math-V2 использовал примерно 65 000 запросов для каждой задачи, чтобы достичь отличных результатов на IMO. Предполагая 32k токенов на запрос, это означает, что он написал примерно 10 000 книг по 600 страниц для каждой задачи. Хорошие вещи.