Ini adalah model ucapan-ke-teks terbaik dan tercepat di dunia: • 23,2 detik untuk memproses audio selama 30 menit • Akurasi 93,3% • Dukungan diarisasi untuk mendeteksi banyak speaker • Dilatih pada 12,5 juta jam data multibahasa Saya mencobanya dan itu cukup mengesankan: