Anthropic ha logrado descifrar el aprendizaje interno de su modelo Claude 3, usando una nueva técnica de interpretabilidad. Con ella han encontrado los numerosos patrones que se esconden en las tripas de la red neuronal, lo cuál no sólo ha permitido entender mejor su funcionamiento, sino también poder controlarla. Hoy explicamos este trabajo.
Comentarios
Y esta probablemente sea la noticia sobre AI del año pero, un video? No hay noticia escrita?
Pensemos en lo que significa "ahora entendemos nuestro modelo".