Questa settimana su Complex Systems sono stato entusiasta di accogliere @joel_bkr di METR per parlare di come misuriamo rigorosamente i progressi degli LLM, un interessante risultato di ricerca che Joel e il team hanno ottenuto di recente, e un piccolo accenno all'organizzazione industriale dell'ingegneria del software.
14,12K