OpenAI presenta MLE-bench: un nuevo estándar para evaluar agentes de Inteligencia Artificial en tareas de ingeniería de Machine Learning

8 meneos

64 clics

OpenAI presenta MLE-bench: un nuevo estándar para evaluar agentes de Inteligencia Artificial en tareas de ingeniería de Machine Learning

Esta nueva herramienta se compone de 75 competiciones seleccionadas cuidadosamente, abarcando una amplia gama de tareas como entrenamiento de modelos, preparación de datos y experimentación, con el fin de proporcionar una medición precisa y detallada de las capacidades de los agentes en entornos reales de ML. arxiv.org/abs/2410.07095

6 2 0 K 11

2 comentarios

6 2 0 K 11

Click para ver los comentarios

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Tecnología, Internet y juegos

más visitadas

Olvídate de Chrome: Google comenzará a rastrear todos tus dispositivos en 8 semanas [ING]

La Generación Z está perdiendo una habilidad que lleva acompañándonos desde hace más de 5.500 años: el 40% cae en fluidez comunicativa

Récord de teletransportación cuántica a través de cables de Internet muy utilizados

Ingenieros austriacos patentan el primer sistema plug-and-play del mundo capaz de construir rascacielos de hasta 24 pisos de madera

Un conductor de Tesla revela su factura de la luz tras instalar un cargador en casa

más votadas

La Generación Z está perdiendo una habilidad que lleva acompañándonos desde hace más de 5.500 años: el 40% cae en fluidez comunicativa

Récord de teletransportación cuántica a través de cables de Internet muy utilizados

Casi 5 millones de euros de sanción a Netflix por ocultar dónde envía los datos de sus usuarios

Ingenieros austriacos patentan el primer sistema plug-and-play del mundo capaz de construir rascacielos de hasta 24 pisos de madera

Un conductor de Tesla revela su factura de la luz tras instalar un cargador en casa

suscripciones por RSS

OpenAI presenta MLE-bench: un nuevo estándar para evaluar agentes de Inteligencia Artificial en tareas de ingeniería de Machine Learning