Kami mengganggu kampanye spionase yang dipimpin AI yang sangat canggih.
Serangan itu menargetkan perusahaan teknologi besar, lembaga keuangan, perusahaan manufaktur kimia, dan lembaga pemerintah. Kami menilai dengan keyakinan tinggi bahwa pelaku ancaman adalah kelompok yang disponsori negara Tiongkok.
Penelitian Antropik Baru: Pengambilan Proyek.
Kami meminta dua tim peneliti Anthropic untuk memprogram anjing robot. Tidak ada tim yang memiliki keahlian robotika—tetapi kami hanya membiarkan satu tim menggunakan Claude.
Bagaimana mereka melakukannya?
Penelitian Antropik Baru: Tanda-tanda introspeksi pada LLM.
Bisakah model bahasa mengenali pemikiran internal mereka sendiri? Atau apakah mereka hanya mengarang jawaban yang masuk akal ketika ditanya tentang mereka? Kami menemukan bukti untuk kemampuan introspektif yang asli—meskipun terbatas—pada Claude.