Acesta este cel mai bun și mai rapid model de vorbire în text din lume: • 23,2 secunde pentru a procesa 30 de minute audio • Precizie de 93,3% • Suport de diarizare pentru detectarea mai multor difuzoare • Instruire pe 12,5 milioane de ore de date multilingve L-am încercat și este destul de impresionant: