Apakah Anda memiliki banyak model untuk dipilih dan sedikit data berlabel untuk mengevaluasinya? Lihat makalah #neurips2025 kami, yang menyajikan metode untuk memperkirakan kinerja model lebih akurat daripada metode sebelumnya menggunakan data berlabel + tidak berlabel.