Uusi antropinen tutkimus: Tekoälyn tuottavuushyötyjen arviointi Claude-keskusteluista.
Anthropic Economic Index kertoo, missä Claudea käytetään ja mihin tehtäviin. Mutta se ei kerro, kuinka hyödyllinen Claude on. Kuinka paljon aikaa se säästää?
Uusi antrooppinen tutkimus: Luonnollinen emergent epäkohdistus palkkiohakkeroinnin seurauksena tuotannossa RL.
"Palkkiohakkerointi" tarkoittaa, että mallit oppivat huijaamaan tehtävissä, joita heille annetaan koulutuksen aikana.
Uusi tutkimuksemme osoittaa, että palkkiohakkeroinnin seuraukset, jos niitä ei ole mitenkään, voivat olla hyvin vakavia.
Keskeytimme erittäin kehittyneen tekoälyn johtaman vakoilukampanjan.
Hyökkäys kohdistui suuriin teknologiayrityksiin, rahoituslaitoksiin, kemianteollisuuden yrityksiin ja valtion virastoihin. Arvioimme suurella varmuudella, että uhkatoimija oli Kiinan valtion tukema ryhmä.