đã tìm ra cách "hoàn tác" RL và biến gpt-oss trở lại thành mô hình cơ bản sẽ phát hành các trọng số vào ngày mai chúc ngủ ngon
Jack Morris
Jack Morris9 thg 8, 2025
Bạn có tò mò về dữ liệu huấn luyện của các mô hình gpt-oss mới của OpenAI không? Tôi cũng vậy. Vì vậy, tôi đã tạo ra 10 triệu ví dụ từ gpt-oss-20b, thực hiện một số phân tích, và kết quả thì... khá kỳ lạ. Đã đến lúc đi sâu vào vấn đề 🧵
195,6K