Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Un aspetto del nostro modello Gemini 3 Pro da considerare è come si comporta nelle capacità multimodali. Abbiamo lavorato per farlo funzionare davvero bene in una varietà di casi d'uso multimodali, come la comprensione di documenti, video, caratteristiche spaziali, dati biomedici e schermi di computer, e la capacità di ragionare sulle informazioni visive.
Per testarlo, ho fornito l'immagine originale del post del blog qui sotto e gli ho chiesto:
Per favore, crea una versione di questa figura con la colonna Gemini Pro annotata con il miglioramento relativo rispetto al miglior risultato delle altre tre colonne in rosso.
(Questo di per sé è un compito di ragionamento visivo piuttosto difficile! Ha fatto abbastanza bene a farlo con precisione in alcuni controlli a campione, e quei miglioramenti di accuratezza relativi sono piuttosto grandi in alcuni dei benchmark!)
Leggi di più qui sotto o nel post del blog a:

Principali
Ranking
Preferiti

