Los modelos de lenguaje pueden explicar las neuronas en los modelos de lenguaje. [EN]

14 meneos

102 clics

Los modelos de lenguaje pueden explicar las neuronas en los modelos de lenguaje. [EN]

Usamos GPT-4 para escribir automáticamente explicaciones sobre el comportamiento de las neuronas en modelos de idiomas grandes y para obtener esas explicaciones. Lanzamos un conjunto de datos de estas explicaciones y puntajes ( imperfectos ) para cada neurona en GPT-2.

11 3 1 K 14

6 comentarios

11 3 1 K 14

#1 --113769-- *

Algunos afirman que es un paso mágico, una especie de (previo a la) introspección. Un bucle en la inteligencia artificial. Una IA que explica como razona otra IA.

1 21

#3 QRK

"Una IA que explica como razona otra IA"

Según entiendo yo, más bien es que las personas que lo desarrollan han añadido una funcionalidad para que el usuario pueda conocer los circuitos por los que va pasando el modelo, a la hora de hacer una predicción.

Para así saber por qué se ha optado por una respuesta y no por otra.

Tampoco es nada del otro mundo.

0 6

#4 --113769--

han usado gpt4 para establecer textos que explican el disparo se neuronas concretas de gpt2. Y lo han extendido en un espacio grande de ejemplos. Son capaces de establecer una prediccion de textos qué explican esa activación.

Es como si pudiéramos analizar cuando se activa e interviene en una respuesta una neurona concreta de tu cerebro. Y lo hiciéramos en un montón de neuronas.

1 21

#6 QRK

En resumen es lo que yo digo. Sólo una funcionalidad extra. Que tampoco aporta nada más allá de saber el camino de la predicción dentro de la red neuronal.

0 6

#2 yurina

Pues claro. Puedes preguntarle a una red de éstas cualquier cosa. Siempre te responderá con algo. No significa mucho.

0 7

#5 --113769--

como? No entiendo tu comentario

1 21

comentarios cerrados

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Noticias de ciencia y lo que la rodea

más visitadas

Esta visualización de la NASA muestra el CO2 emitido a la atmósfera y aclara quién es el responsable del cambio climático

Análisis de ADN revelan la identidad de los Picenos, una civilización enigmática que floreció en el Adriático antes del surgimiento de Roma

El ‘Odón de Buen’ se convierte en el buque oceanográfico más grande y avanzado de España para avanzar en el conocimiento de los océanos y abordar los grandes desafíos ambientales

La democracia no tiene futuro cuando los ciudadanos no entienden de Ciencia

La mitad de las 20 principales ciudades científicas se encuentran ahora en China, y la clave está en el crecimiento de las ciudades regionales [ENG]

más votadas

La democracia no tiene futuro cuando los ciudadanos no entienden de Ciencia

Esta visualización de la NASA muestra el CO2 emitido a la atmósfera y aclara quién es el responsable del cambio climático

El ‘Odón de Buen’ se convierte en el buque oceanográfico más grande y avanzado de España para avanzar en el conocimiento de los océanos y abordar los grandes desafíos ambientales

La mitad de las 20 principales ciudades científicas se encuentran ahora en China, y la clave está en el crecimiento de las ciudades regionales [ENG]

50 años de Lucy: ¿Cómo hemos avanzado en el estudio de fósiles desde su descubrimiento?

suscripciones por RSS

Los modelos de lenguaje pueden explicar las neuronas en los modelos de lenguaje. [EN]