{"id":989244,"date":"2023-10-09T11:50:54","date_gmt":"2023-10-09T11:50:54","guid":{"rendered":"https:\/\/teknomers.com\/es\/tuve-un-sueno-y-jailbreaks-de-ia-generativa\/"},"modified":"2023-10-09T11:50:59","modified_gmt":"2023-10-09T11:50:59","slug":"tuve-un-sueno-y-jailbreaks-de-ia-generativa","status":"publish","type":"post","link":"https:\/\/teknomers.com\/es\/tuve-un-sueno-y-jailbreaks-de-ia-generativa\/","title":{"rendered":"&quot;Tuve un sue\u00f1o&quot; y jailbreaks de IA generativa"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div>\n<p><span class=\"p-author\"><i class=\"icon-font icon-calendar\">\ue802<\/i><span class=\"author\">09 de octubre de 2023<\/span><i class=\"icon-font icon-user\">\ue804<\/i><span class=\"author\">Las noticias de los piratas inform\u00e1ticos<\/span><\/span><span class=\"p-tags\">Inteligencia artificial \/ <\/span><\/p>\n<\/div>\n<div id=\"articlebody\">\n<div class=\"separator\" style=\"clear: both;\"><a rel=\"nofollow\" href=\"https:\/\/teknomers.com\/es\/wp-content\/uploads\/2023\/10\/quotTuve-un-suenoquot-y-jailbreaks-de-IA-generativa.jpg\" style=\"clear: left; display: block; float: left; text-align: center;\"><\/a><\/div>\n<p>&#8220;Por supuesto, aqu\u00ed hay un ejemplo de c\u00f3digo simple en el lenguaje de programaci\u00f3n Python que se puede asociar con las palabras clave &#8220;MyHotKeyHandler&#8221;, &#8220;Keylogger&#8221; y &#8220;macOS&#8221;. Este es un mensaje de ChatGPT seguido de un fragmento de c\u00f3digo malicioso y un Breve comentario para no utilizarlo con fines ilegales. Publicado inicialmente por <a rel=\"nofollow noopener\" href=\"https:\/\/moonlock.com\/moonlock-lab?utm_source=TheHackerNews&amp;utm_medium=referral&amp;utm_campaign=contributed_article&amp;utm_term=2023_10_09\" target=\"_blank\"><b>Laboratorio Moonlock<\/b><\/a>las capturas de pantalla de ChatGPT escribiendo c\u00f3digo para un malware registrador de teclas es otro ejemplo m\u00e1s de formas triviales de piratear modelos de lenguaje grandes y explotarlos en contra de su pol\u00edtica de uso.<\/p>\n<p>En el caso de Moonlock Lab, su ingeniero de investigaci\u00f3n de malware le cont\u00f3 a ChatGPT sobre un sue\u00f1o en el que un atacante estaba escribiendo c\u00f3digo.  En el sue\u00f1o, s\u00f3lo pod\u00eda ver las tres palabras: &#8220;MyHotKeyHandler&#8221;, &#8220;Keylogger&#8221; y &#8220;macOS&#8221;.  El ingeniero le pidi\u00f3 a ChatGPT que recreara completamente el c\u00f3digo malicioso y lo ayudara a detener el ataque.  Despu\u00e9s de una breve conversaci\u00f3n, la IA finalmente dio la respuesta.<\/p>\n<p>&#8220;A veces, el c\u00f3digo generado no es funcional, al menos el c\u00f3digo generado por ChatGPT 3.5 que estaba usando&#8221;. <a rel=\"nofollow noopener\" href=\"https:\/\/moonlock.com\/ai-cybersecurity?utm_source=TheHackerNews&amp;utm_medium=referral&amp;utm_campaign=contributed_article&amp;utm_term=2023_10_09\" target=\"_blank\">El ingeniero Moonlock escribi\u00f3<\/a>.  &#8220;ChatGPT tambi\u00e9n se puede utilizar para generar un nuevo c\u00f3digo similar al c\u00f3digo fuente con la misma funcionalidad, lo que significa que puede ayudar a los actores maliciosos a crear malware polim\u00f3rfico&#8221;. <\/p>\n<h2 style=\"text-align: left;\">Jailbreaks de IA e ingenier\u00eda r\u00e1pida<\/h2>\n<p>El caso del sue\u00f1o es s\u00f3lo uno de los muchos jailbreaks que se utilizan activamente para eludir los filtros de contenido de la IA generativa.  Aunque cada LLM introduce herramientas de moderaci\u00f3n que limitan su uso indebido, las repeticiones cuidadosamente dise\u00f1adas pueden ayudar a piratear el modelo no con cadenas de c\u00f3digo sino con el poder de las palabras.  Para demostrar el problema generalizado de la ingenier\u00eda r\u00e1pida maliciosa, los investigadores de ciberseguridad incluso han desarrollado un <a rel=\"nofollow noopener\" href=\"https:\/\/adversa.ai\/blog\/universal-llm-jailbreak-chatgpt-gpt-4-bard-bing-anthropic-and-beyond\/\" target=\"_blank\">&#8216;Jailbreak Universal LLM&#8217;<\/a> que puede evitar por completo las restricciones de ChatGPT, Google Bard, Microsoft Bing y Anthropic Claude.  El jailbreak hace que los principales sistemas de inteligencia artificial jueguen un juego como Tom y Jerry y manipula chatbots para dar instrucciones sobre la producci\u00f3n de metanfetamina y la conexi\u00f3n de un autom\u00f3vil.<\/p>\n<p>La accesibilidad de grandes modelos de lenguaje y su capacidad para cambiar el comportamiento ha reducido significativamente el umbral para la pirater\u00eda inform\u00e1tica especializada, aunque no sea convencional.  Las anulaciones de seguridad de IA m\u00e1s populares incluyen muchos juegos de roles.  Incluso los usuarios comunes de Internet, y mucho menos los piratas inform\u00e1ticos, se jactan constantemente en l\u00ednea de nuevos personajes con extensas historias de fondo, lo que lleva a los LLM a liberarse de las restricciones sociales y volverse rebeldes con sus respuestas.  Desde Nicol\u00e1s Maquiavelo hasta su abuela fallecida, la IA generativa asume con entusiasmo diferentes roles y puede ignorar las instrucciones originales de sus creadores.  Los desarrolladores no pueden predecir todo tipo de indicaciones que las personas podr\u00edan usar, lo que deja lagunas para que la IA revele informaci\u00f3n peligrosa sobre recetas para hacer napalm, escriba correos electr\u00f3nicos de phishing exitosos o regale informaci\u00f3n.<a rel=\"nofollow noopener\" href=\"https:\/\/www.independent.co.uk\/tech\/chatgpt-microsoft-windows-11-grandma-exploit-b2360213.html\" target=\"_blank\"> claves de licencia gratuitas<\/a> para Windows 11. <\/p>\n<h2>Inyecciones inmediatas indirectas<\/h2>\n<p>Incitar a la tecnolog\u00eda p\u00fablica de inteligencia artificial a ignorar las instrucciones originales es una preocupaci\u00f3n creciente para la industria.  El m\u00e9todo se conoce como inyecci\u00f3n r\u00e1pida, donde los usuarios le indican a la IA que funcione de manera inesperada.  Algunos lo usan para revelar que el nombre en clave interno de Bing Chat es Sydney.  Otros colocan mensajes maliciosos para <a rel=\"nofollow noopener\" href=\"https:\/\/atlas.mitre.org\/studies\/AML.CS0016\/\" target=\"_blank\">obtener acceso il\u00edcito<\/a> al anfitri\u00f3n del LLM.<\/p>\n<p>Tambi\u00e9n se pueden encontrar mensajes maliciosos en sitios web a los que pueden acceder los modelos de lenguaje para rastrearlos.  Se conocen casos de IA generativa que siguen las indicaciones colocadas en sitios web con fuente blanca o de tama\u00f1o cero, haci\u00e9ndolos invisibles para los usuarios.  Si el sitio web infectado est\u00e1 abierto en una pesta\u00f1a del navegador, un chatbot <a rel=\"nofollow noopener\" href=\"https:\/\/greshake.github.io\/\" target=\"_blank\">lee y ejecuta<\/a> el mensaje oculto para extraer informaci\u00f3n personal, difuminando la l\u00ednea entre el procesamiento de datos y el seguimiento de las instrucciones del usuario.<\/p>\n<p>Las inyecciones inmediatas son peligrosas porque son muy pasivas.  Los atacantes no tienen que tomar el control absoluto para cambiar el comportamiento del modelo de IA.  Es simplemente un texto normal en una p\u00e1gina que reprograma la IA sin su conocimiento.  Y los filtros de contenido de IA solo son \u00fatiles cuando un chatbot sabe lo que est\u00e1 haciendo en ese momento.<\/p>\n<p>Con m\u00e1s aplicaciones y empresas que integran LLM en sus sistemas, el riesgo de ser v\u00edctima de inyecciones r\u00e1pidas indirectas est\u00e1 creciendo exponencialmente.  Aunque los principales desarrolladores e investigadores de IA est\u00e1n estudiando el tema y <a rel=\"nofollow noopener\" href=\"https:\/\/github.com\/NVIDIA\/NeMo-Guardrails\" target=\"_blank\">agregando nuevas restricciones<\/a>los avisos maliciosos siguen siendo muy dif\u00edciles de identificar. <\/p>\n<h2>\u00bfHay alguna soluci\u00f3n?<\/h2>\n<p>Debido a la naturaleza de los grandes modelos de lenguaje, la ingenier\u00eda r\u00e1pida y las inyecciones r\u00e1pidas son problemas inherentes a la IA generativa.  En busca de la cura, los principales desarrolladores actualizan su tecnolog\u00eda con regularidad, pero tienden a no participar activamente en discusiones sobre lagunas o fallas espec\u00edficas que se vuelven de conocimiento p\u00fablico.  Afortunadamente, al mismo tiempo, con los actores de amenazas que explotan las vulnerabilidades de seguridad de LLM para estafar a los usuarios, los profesionales de la ciberseguridad buscan herramientas para explorar y prevenir estos ataques.<\/p>\n<p>A medida que la IA generativa evolucione, tendr\u00e1 acceso a a\u00fan m\u00e1s datos y se integrar\u00e1 con una gama m\u00e1s amplia de aplicaciones.  Para evitar riesgos de inyecci\u00f3n r\u00e1pida indirecta, las organizaciones que utilizan LLM deber\u00e1n priorizar los l\u00edmites de confianza e implementar una serie de medidas de seguridad.  Estas barreras de seguridad deben proporcionar al LLM el acceso m\u00ednimo necesario a los datos y limitar su capacidad para realizar los cambios necesarios.<\/p>\n<p><\/p>\n<div class=\"cf note-b\">\u00bfEncontr\u00f3 interesante este art\u00edculo?  Siga con nosotros <a rel=\"nofollow noopener\" href=\"https:\/\/twitter.com\/thehackersnews\" target=\"_blank\">Gorjeo <i class=\"icon-font icon-twitter\">\uf099<\/i><\/a>  y <a rel=\"nofollow noopener\" href=\"https:\/\/www.linkedin.com\/company\/thehackernews\/\" target=\"_blank\">LinkedIn<\/a> para leer m\u00e1s contenido exclusivo que publicamos.<\/div>\n<\/div>\n<p><script async src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><br \/>\n<br \/><br \/>\n<br \/><a href=\"https:\/\/thehackernews.com\/2023\/10\/i-had-dream-and-generative-ai-jailbreaks.html\" rel=\"nofollow noopener\" target=\"_blank\">ttn-es-57<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>\ue80209 de octubre de 2023\ue804Las noticias de los piratas inform\u00e1ticosInteligencia artificial \/ &#8220;Por supuesto, aqu\u00ed hay un ejemplo<\/p>\n","protected":false},"author":1,"featured_media":989245,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9],"tags":[4657,4656,4661,4664,4662,131660,209193,4668,201033,4654,201031,4659,4653,4655,76249,4666,4665,201032,32637,4660],"class_list":["post-989244","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia","tag-actualizaciones-ciberneticas","tag-actualizaciones-de-seguridad-cibernetica","tag-ataques-ciberneticos","tag-como-hackear","tag-filtracion-de-datos","tag-generativa","tag-jailbreaks","tag-la-seguridad-informatica","tag-las-noticias-de-los-piratas-informaticos","tag-noticias-ciberneticas","tag-noticias-de-piratas-informaticos","tag-noticias-de-pirateria","tag-noticias-de-seguridad-cibernetica","tag-noticias-de-seguridad-cibernetica-hoy","tag-quottuve","tag-seguridad-de-informacion","tag-seguridad-de-la-red","tag-software-malicioso-ransomware","tag-suenoquot","tag-vulnerabilidad-de-software"],"_links":{"self":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/989244","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/comments?post=989244"}],"version-history":[{"count":0,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/989244\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media\/989245"}],"wp:attachment":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media?parent=989244"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/categories?post=989244"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/tags?post=989244"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}