Мы сорвали высокосложную шпионскую кампанию, управляемую ИИ.
Атака была нацелена на крупные технологические компании, финансовые учреждения, компании по производству химикатов и государственные агентства. Мы с высокой уверенностью оцениваем, что угрозу представляла группа, спонсируемая государством Китая.
Новое исследование Anthropic: Проект Fetch.
Мы попросили две команды исследователей Anthropic запрограммировать робота-собаку. Ни у одной из команд не было опыта в робототехнике, но только одной команде разрешили использовать Claude.
Как они справились?
Новое исследование Anthropic: Признаки интроспекции в LLM.
Могут ли языковые модели распознавать свои собственные внутренние мысли? Или они просто придумывают правдоподобные ответы, когда их об этом спрашивают? Мы нашли доказательства подлинных — хотя и ограниченных — интроспективных способностей в Claude.