Usamos GPT-4 para escribir automáticamente explicaciones sobre el comportamiento de las neuronas en modelos de idiomas grandes y para obtener esas explicaciones. Lanzamos un conjunto de datos de estas explicaciones y puntajes ( imperfectos ) para cada neurona en GPT-2.
|
etiquetas: modelos , lenguaje , explicar , gpt4
Según entiendo yo, más bien es que las personas que lo desarrollan han añadido una funcionalidad para que el usuario pueda conocer los circuitos por los que va pasando el modelo, a la hora de hacer una predicción.
Para así saber por qué se ha optado por una respuesta y no por otra.
Tampoco es nada del otro mundo.
Es como si pudiéramos analizar cuando se activa e interviene en una respuesta una neurona concreta de tu cerebro. Y lo hiciéramos en un montón de neuronas.