Nova pesquisa antrópica: filtrando informações perigosas no pré-treinamento. Estamos experimentando maneiras de remover informações sobre armas químicas, biológicas, radiológicas e nucleares (QBRN) dos dados de treinamento de nossos modelos sem afetar o desempenho em tarefas inofensivas.
227,65K