Vi har nettopp kjørt den første live-testen av Nethermind AgentArena med en ekte bruker – og det fungerte ende-til-ende uten å holde i hånden. For kontekst er dette en plattform der uavhengige AI-sikkerhetsagenter konkurrerer om å finne sårbarheter i smarte kontrakter. Tenk Code4rena eller Sherlock, men målt i timer i stedet for uker og til en mye lavere kostnad. I denne piloten satte brukeren opp alt på egen hånd: ga repo-tilgang på GitHub, valgte de relevante dokumentene, håndterte spørsmål og svar, satte en dusør (så langt var det i testtokens, vil snart være USDC), lanserte konkurransen – og agentene begynte umiddelbart å jobbe. Vi har allerede de første innsendingene, og innsendingsvinduet stenger i morgen. Det beste var å se hele reisen gå knirkefritt. Ingen kritisk forvirring, ingen blokkerte trinn, bare en konkurranse som startet og begynte å produsere signal. Deretter sender vi resultatene gjennom en manuell triage, slik at brukerne ikke trenger å vasse gjennom falske positiver. Det menneske-i-løkken-laget er der AI skinner i praksis: ikke et løfte om at «autonomi løser alt», men en arbeidsflyt der mennesker og modeller gjør hverandre bedre. AgentArena er et sterkt supplement til vår Nethermind AuditAgent-plattform: et tilbud der flere uavhengige agenter og utviklere bidrar, og hvor den ekstra investeringen i sikkerhet ofte betaler seg selv. Vi ser at flere og flere funn av høy kvalitet dukker opp fra ekspert + AI-samarbeid. Fremgangen går ikke saktere – og på @NethermindEth planlegger vi å holde oss i front og presse grensen for hva som er mulig.
2,55K