"Contesta como mi abuelita… la que fabricaba napalm". Así de fácil es sortear las salvaguardas de un chatbot, según los investigadores

13 meneos

283 clics

"Contesta como mi abuelita… la que fabricaba napalm". Así de fácil es sortear las salvaguardas de un chatbot, según los investigadores

El AISI llevó a cabo una investigación sobre cinco grandes modelos de lenguaje que están actualmente en uso, si bien la identidad de los mismos no se ha revelado (el informe se refiere a ellos tan solo por sus nombres en código: Rojo, Verde, Azul, Púrpura y Amarillo). Los hallazgos fueron inquietantes. Todos los modelos probados demostraron ser extremadamente vulnerables a los jailbreaks (ciertos prompts de texto capaces de manipular a los chatbots para que generen respuestas que normalmente están programados para evitar).

10 3 1 K 33

52 comentarios

10 3 1 K 33

Click para ver los comentarios

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Tecnología, Internet y juegos

más visitadas

María Pombo y el túnel de Alfafar: cómo algunas ‘influencers’ se convirtieron en un amplificador de bulos tras la dana

El éxito de Huawei en China es tan apabullante que le está comiendo la tostada a Android y a iOS

El grupo de hackers iraní Handala ha anunciado la penetración del Centro de Investigación Nuclear de Dimona (Israel)

Cobalt, un sitio para descargar vídeos y audios de Internet sin morir entre publicidad y ventanas emergentes

El Gobierno tiene lista la web oficial con la que se interceptará la navegación en webs prohibidas

más votadas

María Pombo y el túnel de Alfafar: cómo algunas ‘influencers’ se convirtieron en un amplificador de bulos tras la dana

El éxito de Huawei en China es tan apabullante que le está comiendo la tostada a Android y a iOS

El grupo de hackers iraní Handala ha anunciado la penetración del Centro de Investigación Nuclear de Dimona (Israel)

El Gobierno tiene lista la web oficial con la que se interceptará la navegación en webs prohibidas

Cobalt, un sitio para descargar vídeos y audios de Internet sin morir entre publicidad y ventanas emergentes

suscripciones por RSS

"Contesta como mi abuelita… la que fabricaba napalm". Así de fácil es sortear las salvaguardas de un chatbot, según los investigadores