Een nieuwe presentatie van 30 minuten van @aelluswamy, Tesla’s VP van AI, is uitgebracht, waarin hij praat over FSD, AI en de laatste vooruitgang van het team. Hoogtepunten uit de presentatie: • Tesla's voertuigenpark kan elke dag 500 jaar aan rijgegevens leveren. Vloek van dimensionaliteit: • 8 camera's met hoge framerate = miljarden tokens per 30 seconden rijcontext. • Tesla moet de juiste correlaties tussen sensorische input en controle-acties comprimeren en extraheren. Data-voordeel: • Tesla heeft toegang tot een "Niagara Falls aan data" — honderden jaren aan collectieve rijervaring van het voertuigenpark. • Maakt gebruik van slimme datatriggers om zeldzame randgevallen vast te leggen (bijv. complexe kruispunten, onvoorspelbaar gedrag). Kwaliteit en efficiëntie: • Extraheert alleen de essentiële gegevens die nodig zijn om modellen efficiënt te trainen. Debugging en interpreteerbaarheid: • Hoewel het systeem end-to-end is, kan Tesla het model nog steeds aansteken om interpreteerbare gegevens uit te geven: 3D-bezetting, weggrenzen, objecten, borden, verkeerslichten, enz. • Natuurlijke taalquery's: vraag het model waarom het een bepaalde beslissing heeft genomen. • Deze aanvullende voorspellingen sturen de auto niet, maar helpen ingenieurs bij het debuggen en waarborgen van de veiligheid. Tesla’s geavanceerde Gaussian Splatting (3D-scène modellering): • Tesla heeft een op maat gemaakt, ultra-snel Gaussian splatting-systeem ontwikkeld om 3D-scènes te reconstrueren vanuit beperkte camerazichten. • Produceert scherpe, nauwkeurige 3D-renderingen, zelfs vanuit enkele camerahoeken — veel beter dan standaard NeRF/splatting benaderingen. • Stelt snelle visuele debugging van de rijomgeving in 3D mogelijk. Evaluatie & wereldmodellen: • Evaluatie is de moeilijkste uitdaging: modellen kunnen offline goed presteren, maar falen in de echte wereld. • Tesla bouwt gebalanceerde, diverse evaluatiedatasets met focus op randgevallen — niet alleen gemakkelijk snelweg rijden....