Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
La Box, petrecem mult timp testând Box AI cu noi modele pe date nestructurate pentru a vedea la ce se descurcă bine în domenii reale de lucru.
După cum am văzut din benchmark-uri, GPT-5 oferă un salt semnificativ în capacitate față de GPT-4.1 în raționament, matematică, logică, codare și alte domenii de lucru. Iată câteva exemple în care aceste îmbunătățiri intră în joc în lumea reală:
*GPT 5 contextualizează mai bine informațiile. Când se extrag date, cum ar fi suma finală USD de pe o factură fără etichete valutare, dar cu o adresă în Londra, GPT 5 răspunde corect având nevoie de o rată de conversie de la USD la GBP. În comparație, GPT 4.1 a văzut factura finală și a returnat-o, presupunând moneda (incorect).
* GPT-5 oferă o analiză multimodală mai bună. Pentru depunerea anuală a unei companii publice, GPT-5 este rugat să izoleze o celulă dintr-un tabel de o imagine care arată modificările componentelor de capital ale companiei. Partea de sus a tabelului clarifică faptul că toate valorile acțiunilor sunt în mii, iar GPT-5 menționează clar această conversie, în timp ce GPT-4.1 nu, devenind confuz având în vedere că tabelul spune acțiuni și legenda spune acțiuni.
* GPT-5 funcționează mai bine cu niveluri ridicate de promptitudine și complexitate a datelor. Când a făcut extragerea datelor pe un CV pentru toate datele de începere a locurilor de muncă, numele posturilor și numele angajatorilor, GPT-5 a reușit să extragă fiecare bucată de date, în timp ce GPT-4.1 pare să fie copleșit și nu a extras aceleași câmpuri, având în vedere dimensiunea solicitării și complexitatea documentului.
* GPT-5 este mult mai clar și mai explicit în răspunsurile sale. Într-un acord de externalizare cu 6 servicii diferite discutate în mod explicit, atunci când a fost întrebat despre "cele 5 servicii specifice din contract", GPT-5 le va returna pe primele 5 și va întreba dacă a fost intenționat că al șaselea nu a fost întrebat. În comparație, GPT-4.1 a returnat pur și simplu primele 5 fără alte avertismente, ceea ce poate duce la confuzie în aval pentru utilizator.
* GPT-5 este mai bun la interpretarea datelor în domenii complexe. Pentru o diagramă de citometrie în flux, utilizată de obicei în imunologie, GPT-5 a identificat corect o proporție mare de celule moarte și a dat cauze plauzibile care ar putea duce la situație, în timp ce GPT-4.1 a oferit un raționament minim, având nevoie de confirmări suplimentare pentru a avea presupuneri din date brute.
* GPT-5 este mai capabil să identifice inconsecvențele în cod. Când i s-a cerut să identifice probleme într-un anumit fișier de cod python, în timp ce atât GPT-5, cât și 4.1 pot identifica erori reale care duc la defecțiuni, doar GPT-5 a reușit să deducă probleme mai subtile, cum ar fi imprimarea variabilei incorecte atunci când acest lucru nu ar avea sens în contextul programului.
Aceste îmbunătățiri în matematică, raționament, logică și calitate a răspunsurilor în ferestre de context mai lungi sunt incredibil de utile pentru utilizatorii finali în munca de zi cu zi, dar vor apărea și mai mult cu agenți AI cu rulare mai lungă, mai ales atunci când nu există niciun om în buclă pentru a verifica informațiile la fiecare pas.
Este minunat să vedem că aceste îmbunătățiri continuă să apară în cea mai recentă recoltă de modele AI, deoarece acest lucru va duce la agenți AI care pot fi utilizați în domenii de lucru din ce în ce mai critice.
78,25K
Limită superioară
Clasament
Favorite