Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
Jag läser den här rapporten från Anthropic om verklig användning av Claude och siffrorna slår till som en tegelsten.
De gick igenom 100 000 samtal.
Här är delen som fick mig att stanna:
De flesta uppgifter som folk tar med till Claude tar normalt omkring 90 minuter.
Med Claude slutförs samma uppgifter 80 procent snabbare.
Det är någon som sparar timmar varje vecka utan att ens försöka.
Sedan blir rapporten större.
Om man tillämpar dessa vinster på hela den amerikanska ekonomin, driver dagens modeller ensamma upp arbetsproduktiviteten med 1,8 procent per år under det kommande decenniet.
Nästan dubbelt så mycket som på sistone.
Och inget av detta inkluderar bättre modeller.
Det är bara så folk redan använder Claude just nu.
Det här kan vara första gången vi ser hårda bevis på vad AI gör inne i verkliga jobb.
Tyst skift.
Enorm påverkan.
Det händer redan.

2,7K
Den här MIT-artikeln blåste verkligen bort mitt sinne 🤯
Artikeln handlar om "ARC" och det förändrade helt hur jag ser på benchmarken.
Forskarna behandlade inte ARC som ett logiskt pussel alls. De behandlade varje uppgift som en visuell förvandling.
Rutnät in → rutnät ut. Inget är mer komplicerat än så.
De byggde en liten Vision Transformer, tränade den från grunden på ARC:s lilla dataset och använde ett enkelt canvastrick för att placera varje exempel som en bild.
Sedan lade de till skaländringar, translationer och grundläggande visuella förmågor som man ser i klassiskt datorseendearbete.
Det är allt.
Ingen tankekedja, inga uppmaningar, inga smarta symboliska trick.
Bara en modell som tittar på pixlar och lär sig hur former rör sig, vänder, växer, kollapsar eller förs över.
Den vilda delen?
Denna lilla modell når 54,5 % ensam och 60,4 % i kombination med en U-Net.
Det är ungefär genomsnittlig mänsklig prestation med en modell som passar in i storleken av en liten mobilapp.
Att se ARC löst på detta sätt gör att hela benchmarken känns annorlunda.
Uppgifterna ser plötsligt ut som bildmappningar istället för dolda regler. Reflektionsuppgifter ser faktiskt ut som reflektioner.
Symmetriuppgifter ser ut som symmetri. Gravitationsuppgifter ser ut som delar som "faller" rakt ner på duken.
Jag håller ärligt talat fortfarande på att bearbeta det.
Det här kan vara det mest jordnära ARC-resultatet jag läst på flera år och det kom från att jag behandlade benchmarken på det mest bokstavliga sättet någon någonsin gjort.

3,6K
Topp
Rankning
Favoriter


