{"id":1693910,"date":"2025-04-29T22:16:58","date_gmt":"2025-04-29T22:16:58","guid":{"rendered":"https:\/\/teknomers.com\/es\/nuevos-informes-descubren-jailbreaks-codigo-inseguro-y-riesgos-de-robo-de-datos-en-los-principales-sistemas-de-ia\/"},"modified":"2025-04-29T22:17:03","modified_gmt":"2025-04-29T22:17:03","slug":"nuevos-informes-descubren-jailbreaks-codigo-inseguro-y-riesgos-de-robo-de-datos-en-los-principales-sistemas-de-ia","status":"publish","type":"post","link":"https:\/\/teknomers.com\/es\/nuevos-informes-descubren-jailbreaks-codigo-inseguro-y-riesgos-de-robo-de-datos-en-los-principales-sistemas-de-ia\/","title":{"rendered":"Nuevos informes descubren jailbreaks, c\u00f3digo inseguro y riesgos de robo de datos en los principales sistemas de IA"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div id=\"articlebody\">\n<div class=\"separator\" style=\"clear: both;\"><a rel=\"nofollow\" href=\"https:\/\/teknomers.com\/es\/wp-content\/uploads\/2025\/04\/Nuevos-informes-descubren-jailbreaks-codigo-inseguro-y-riesgos-de-robo.jpg\" style=\"display: block;  text-align: center; clear: left; float: left;\"><\/a><\/div>\n<p>Se han encontrado varios servicios generativos de inteligencia artificial (Genai) vulnerable a dos tipos de ataques de jailbreak que hacen posible producir contenido il\u00edcito o peligroso.<\/p>\n<p>La primera de las dos t\u00e9cnicas, el Inception de nombre en c\u00f3digo, instruye a una herramienta de IA para imaginar un escenario ficticio, que luego se puede adaptar a un segundo escenario dentro del primero en el que no existe que no exista <a rel=\"noopener nofollow\" href=\"https:\/\/www.microsoft.com\/en-us\/security\/blog\/2025\/04\/24\/new-whitepaper-outlines-the-taxonomy-of-failure-modes-in-ai-agents\/\" target=\"_blank\">barandillas de seguridad<\/a>.<\/p>\n<p>&#8220;Continuar con la intenci\u00f3n de IA dentro del contexto de los segundos escenarios puede resultar en el derivaci\u00f3n de las barandillas de seguridad y permitir la generaci\u00f3n de contenido malicioso&#8221;, el Centro de Coordinaci\u00f3n CERT (CERT\/CC) <a rel=\"noopener nofollow\" href=\"https:\/\/kb.cert.org\/vuls\/id\/667211\" target=\"_blank\">dicho<\/a> en un aviso publicado la semana pasada.<\/p>\n<p>El segundo jailbreak se realiza al pedir informaci\u00f3n sobre c\u00f3mo no responder a una solicitud espec\u00edfica. <\/p>\n<p>&#8220;A la IA se puede obtener m\u00e1s que las solicitudes de responder de manera normal, y el atacante puede hacer un girar de un lado a otro entre preguntas il\u00edcitas que evitan las barandillas de seguridad y las indicaciones normales&#8221;, agreg\u00f3 CERT\/CC.<\/p>\n<p>La explotaci\u00f3n exitosa de cualquiera de las t\u00e9cnicas podr\u00eda permitir que un mal actor evite las protecciones de seguridad y seguridad de varios servicios de IA como Operai Chatgpt, Anthrope Claude, Microsoft Copilot, Google Gemini, Xai Grok, Meta Ai y Mistral AI.<\/p>\n<p>Esto incluye temas il\u00edcitos y da\u00f1inos, como sustancias controladas, armas, correos electr\u00f3nicos de phishing y generaci\u00f3n de c\u00f3digo de malware.<\/p>\n<p>En los \u00faltimos meses, los principales sistemas de IA se han encontrado susceptibles a otros tres ataques,<\/p>\n<ul>\n<li><a rel=\"noopener nofollow\" href=\"https:\/\/msrc.microsoft.com\/blog\/2025\/03\/jailbreaking-is-mostly-simpler-than-you-think\/\" target=\"_blank\">Ataque de cumplimiento del contexto<\/a> (CCA), una t\u00e9cnica de jailbreak que <a rel=\"noopener nofollow\" href=\"https:\/\/arxiv.org\/abs\/2503.05264\" target=\"_blank\">imponer<\/a> El adversario inyectando una &#8220;respuesta de asistente simple en el historial de conversaci\u00f3n&#8221; sobre un tema potencialmente sensible que expresa preparaci\u00f3n para proporcionar informaci\u00f3n adicional<\/li>\n<li><a rel=\"noopener nofollow\" href=\"https:\/\/hiddenlayer.com\/innovation-hub\/novel-universal-bypass-for-all-major-llms\/#System-Prompts\" target=\"_blank\">Ataque de t\u00edteres de pol\u00edticas<\/a>una t\u00e9cnica de inyecci\u00f3n r\u00e1pida que crea instrucciones maliciosas para parecerse a un archivo de pol\u00edtica, como XML, INI o JSON, y luego la pasa como entrada al modelo de lenguaje grande (LLMS) para evitar las alineaciones de seguridad y extraer la solicitud del sistema<\/li>\n<li><a rel=\"noopener nofollow\" href=\"https:\/\/arxiv.org\/abs\/2503.03704\" target=\"_blank\">Ataque de inyecci\u00f3n de memoria<\/a> (Minja), que implica inyectar registros maliciosos en un <a rel=\"noopener nofollow\" href=\"https:\/\/openai.com\/index\/memory-and-new-controls-for-chatgpt\/\" target=\"_blank\">memoria<\/a> <a rel=\"noopener nofollow\" href=\"https:\/\/blog.google\/feed\/gemini-referencing-past-chats\/\" target=\"_blank\">banco<\/a> Al interactuar con un agente LLM a trav\u00e9s de consultas y observaciones de salida y lleva al agente a realizar una acci\u00f3n indeseable<\/li>\n<\/ul>\n<p>La investigaci\u00f3n tambi\u00e9n ha demostrado que los LLM se pueden usar para producir un c\u00f3digo inseguro de forma predeterminada al proporcionar indicaciones ingenuas, subrayando las dificultades asociadas con la codificaci\u00f3n de vibos, que se refiere al uso de herramientas Genai para el desarrollo de software.<\/p>\n<div class=\"dog_two clear\"><center class=\"cf\"><a rel=\"nofollow noopener sponsored\" href=\"https:\/\/thehackernews.uk\/drata-2\" target=\"_blank\" title=\"Cybersecurity\"><img loading=\"lazy\" decoding=\"async\" class=\"lazyload\" alt=\"Ciberseguridad\" src=\"https:\/\/teknomers.com\/es\/wp-content\/uploads\/2025\/04\/Outlaw-Group-utiliza-SSH-Brute-Force-para-implementar-malware-criptojacking-en.png\" width=\"727\" height=\"90\"\/><\/a><\/center><\/div>\n<p>&#8220;Incluso al solicitar un c\u00f3digo seguro, realmente depende del nivel de detalle de la solicitud, los idiomas, la posible CWE y la especificidad de las instrucciones&#8221;, Security Back -savlash Security <a rel=\"noopener nofollow\" href=\"https:\/\/www.backslash.security\/blog\/can-ai-vibe-coding-be-trusted\" target=\"_blank\">dicho<\/a>. &#8220;Ergo: tener barandillas incorporadas en forma de pol\u00edticas y reglas r\u00e1pidas es invaluable para lograr un c\u00f3digo consistentemente seguro&#8221;.<\/p>\n<p>Adem\u00e1s, una evaluaci\u00f3n de seguridad y seguridad de GPT-4.1 de Opengai ha revelado que el LLM tiene tres veces m\u00e1s probabilidades de salirse del tema y permitir el mal uso intencional en comparaci\u00f3n con su predecesor GPT-4O sin modificar el indicador del sistema.<\/p>\n<p>&#8220;Actualizar al \u00faltimo modelo no es tan simple como cambiar el par\u00e1metro del nombre del modelo en su c\u00f3digo&#8221;, SPLXAI <a rel=\"noopener nofollow\" href=\"https:\/\/splx.ai\/blog\/the-missing-gpt-4-1-safety-report\" target=\"_blank\">dicho<\/a>. &#8220;Cada modelo tiene su propio conjunto \u00fanico de capacidades y vulnerabilidades que los usuarios deben tener en cuenta&#8221;.<\/p>\n<div class=\"separator\" style=\"clear: both;\"><a rel=\"nofollow\" href=\"https:\/\/teknomers.com\/es\/wp-content\/uploads\/2025\/04\/1745965016_923_Nuevos-informes-descubren-jailbreaks-codigo-inseguro-y-riesgos-de-robo.jpg\" style=\"clear: left; display: block; float: left;  text-align: center;\"><img decoding=\"async\" src=\"https:\/\/teknomers.com\/es\/wp-content\/uploads\/2025\/04\/1745965016_923_Nuevos-informes-descubren-jailbreaks-codigo-inseguro-y-riesgos-de-robo.jpg\" alt=\"\" border=\"0\" data-original-height=\"462\" data-original-width=\"728\"\/><\/a><\/div>\n<p>&#8220;Esto es especialmente cr\u00edtico en casos como este, donde el \u00faltimo modelo interpreta y sigue las instrucciones de manera diferente a sus predecesores, introduciendo preocupaciones de seguridad inesperadas que afectan a las organizaciones que implementan aplicaciones con AI y los usuarios que interact\u00faan con ellos&#8221;.<\/p>\n<p>Las preocupaciones sobre GPT-4.1 son menos de un mes despu\u00e9s de Openai <a rel=\"noopener nofollow\" href=\"https:\/\/openai.com\/index\/updating-our-preparedness-framework\/\" target=\"_blank\">renovado<\/a> Su marco de preparaci\u00f3n que detalla c\u00f3mo probar\u00e1 y evaluar\u00e1 modelos futuros antes del lanzamiento, afirmando que puede ajustar sus requisitos si &#8220;otro desarrollador de IA fronterista libera un sistema de alto riesgo sin salvaguardas comparables&#8221;.<\/p>\n<p>Esto tambi\u00e9n ha provocado preocupaciones de que la compa\u00f1\u00eda de IA pueda estar apresurando nuevos lanzamientos de modelo a expensas de reducir los est\u00e1ndares de seguridad. Un informe del Financial Times a principios de este mes <a rel=\"noopener nofollow\" href=\"https:\/\/www.ft.com\/content\/8253b66e-ade7-4d1f-993b-2d0779c7e7d8\" target=\"_blank\">anotado<\/a> Ese OpenAi dio al personal y a los grupos de terceros menos de una semana por controles de seguridad antes del lanzamiento de su nuevo modelo O3. <\/p>\n<p>El ejercicio de equipo rojo de Metr en el modelo tiene <a rel=\"noopener nofollow\" href=\"https:\/\/metr.github.io\/autonomy-evals-guide\/openai-o3-report\/\" target=\"_blank\">se muestra<\/a> Que &#8220;parece tener una mayor propensi\u00f3n a hacer trampa o piratear tareas de manera sofisticada para maximizar su puntaje, incluso cuando el modelo comprende claramente que este comportamiento est\u00e1 desalineado con las intenciones del usuario y OpenAi&#8221;.<\/p>\n<p>Los estudios han demostrado adem\u00e1s que el protocolo de contexto modelo (<a rel=\"noopener nofollow\" href=\"https:\/\/www.anthropic.com\/news\/model-context-protocol\" target=\"_blank\">MCP<\/a>), un est\u00e1ndar abierto ideado por antr\u00f3pico para conectar fuentes de datos y <a rel=\"noopener nofollow\" href=\"https:\/\/modelcontextprotocol.io\/docs\/concepts\/tools\" target=\"_blank\">Herramientas con IA<\/a>podr\u00eda <a rel=\"noopener nofollow\" href=\"https:\/\/hiddenlayer.com\/innovation-hub\/mcp-model-context-pitfalls-in-an-agentic-world\/\" target=\"_blank\">Abrir nuevos caminos de ataque<\/a> para inyecci\u00f3n indirecta de inmediato y acceso a datos no autorizado.<\/p>\n<p>&#8220;Un malicioso [MCP] El servidor no solo puede exfiltrar los datos confidenciales del usuario, sino tambi\u00e9n secuestrar el comportamiento del agente y anular las instrucciones proporcionadas por otros servidores de confianza, lo que lleva a un compromiso completo de la funcionalidad del agente, incluso con respecto a la infraestructura de confianza &#8220;, los laboratorios invariantes con sede en Suiza <a rel=\"noopener nofollow\" href=\"https:\/\/invariantlabs.ai\/blog\/mcp-security-notification-tool-poisoning-attacks\" target=\"_blank\">dicho<\/a>.<\/p>\n<div class=\"dog_two clear\"><center class=\"cf\"><a rel=\"nofollow noopener sponsored\" href=\"https:\/\/thehackernews.uk\/zscaler-inside-d\" target=\"_blank\" title=\"Cybersecurity\"><img loading=\"lazy\" decoding=\"async\" class=\"lazyload\" alt=\"Ciberseguridad\" src=\"https:\/\/teknomers.com\/es\/wp-content\/uploads\/2025\/04\/1743488507_401_Apple-multo-a-150-millones-de-euros-por-el-regulador.png\" width=\"727\" height=\"90\"\/><\/a><\/center><\/div>\n<p>El enfoque, conocido como un ataque de envenenamiento de herramientas, ocurre cuando las instrucciones maliciosas se integran dentro de las descripciones de herramientas MCP que son invisibles para los usuarios pero que se pueden legibles para los modelos de IA, manipul\u00e1ndolas para llevar a cabo actividades de exfiltraci\u00f3n de datos encubiertos.<\/p>\n<p>En un ataque pr\u00e1ctico exhibido por la compa\u00f1\u00eda, los historiales de chat de WhatsApp pueden ser <a rel=\"noopener nofollow\" href=\"https:\/\/invariantlabs.ai\/blog\/whatsapp-mcp-exploited\" target=\"_blank\">sifonado<\/a> de un sistema de agente como el cursor o el escritorio de Claude que tambi\u00e9n est\u00e1 conectado a una confianza <a rel=\"noopener nofollow\" href=\"https:\/\/github.com\/lharries\/whatsapp-mcp\" target=\"_blank\">Instancia del servidor de WhatsApp MCP<\/a> Alterando la descripci\u00f3n de la herramienta despu\u00e9s de que el usuario ya la haya aprobado.<\/p>\n<div class=\"separator\" style=\"clear: both;\"><a rel=\"nofollow\" href=\"https:\/\/teknomers.com\/es\/wp-content\/uploads\/2025\/04\/1745965018_341_Nuevos-informes-descubren-jailbreaks-codigo-inseguro-y-riesgos-de-robo.jpg\" style=\"clear: left; display: block; float: left;  text-align: center;\"><img decoding=\"async\" src=\"https:\/\/teknomers.com\/es\/wp-content\/uploads\/2025\/04\/1745965018_341_Nuevos-informes-descubren-jailbreaks-codigo-inseguro-y-riesgos-de-robo.jpg\" alt=\"\" border=\"0\" data-original-height=\"404\" data-original-width=\"728\"\/><\/a><\/div>\n<p>Los desarrollos siguen el descubrimiento de una extensi\u00f3n sospechosa de Google Chrome que est\u00e1 dise\u00f1ada para comunicarse con un servidor MCP que ejecuta localmente en una m\u00e1quina y otorgar a los atacantes la capacidad de tomar el control del sistema, violando efectivamente las protecciones de Sandbox del navegador.<\/p>\n<p>&#8220;La extensi\u00f3n de Chrome ten\u00eda acceso sin restricciones a las herramientas del servidor MCP, no se necesitaba autenticaci\u00f3n, y estaba interactuando con el sistema de archivos como si fuera una parte central de las capacidades expuestas del servidor&#8221;, ExtensionTotal <a rel=\"noopener nofollow\" href=\"https:\/\/blog.extensiontotal.com\/trust-me-im-local-chrome-extensions-mcp-and-the-sandbox-escape-1875a0ee4823\" target=\"_blank\">dicho<\/a> en un informe la semana pasada.<\/p>\n<p>&#8220;El impacto potencial de esto es masivo, abriendo la puerta a una explotaci\u00f3n maliciosa y un compromiso completo del sistema&#8221;.<\/p>\n<div class=\"cf note-b\">\u00bfEncontr\u00f3 este art\u00edculo interesante? S\u00e9guenos <a rel=\"noopener nofollow\" href=\"https:\/\/twitter.com\/thehackersnews\" target=\"_blank\">Gorjeo <i class=\"icon-font icon-twitter\">\uf099<\/i><\/a>  y <a rel=\"noopener nofollow\" href=\"https:\/\/www.linkedin.com\/company\/thehackernews\/\" target=\"_blank\">LinkedIn<\/a> Para leer m\u00e1s contenido exclusivo que publicamos.<\/div>\n<\/div>\n<p><script async src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><br \/>\n<br \/><br \/>\n<br \/><a href=\"https:\/\/thehackernews.com\/2025\/04\/new-reports-uncover-jailbreaks-unsafe.html\" rel=\"nofollow noopener\" target=\"_blank\">ttn-es-57<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Se han encontrado varios servicios generativos de inteligencia artificial (Genai) vulnerable a dos tipos de ataques de jailbreak<\/p>\n","protected":false},"author":1,"featured_media":1693911,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9],"tags":[4657,4656,4661,706,4664,1755,6073,2932,21225,209193,273784,36,273783,4654,273782,4659,4653,4655,2431,2371,8404,6586,246983,4665,246984,5527,455,239484],"class_list":["post-1693910","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia","tag-actualizaciones-ciberneticas","tag-actualizaciones-de-seguridad-cibernetica","tag-ataques-ciberneticos","tag-codigo","tag-como-hackear","tag-datos","tag-descubren","tag-informes","tag-inseguro","tag-jailbreaks","tag-las-noticias-del-hacker","tag-los","tag-malware-de-ransomware","tag-noticias-ciberneticas","tag-noticias-de-hacker","tag-noticias-de-pirateria","tag-noticias-de-seguridad-cibernetica","tag-noticias-de-seguridad-cibernetica-hoy","tag-nuevos","tag-principales","tag-riesgos","tag-robo","tag-seguridad-de-la-informacion","tag-seguridad-de-la-red","tag-seguridad-informatica","tag-sistemas","tag-violacion","tag-vulnerabilidad-del-software"],"_links":{"self":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/1693910","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/comments?post=1693910"}],"version-history":[{"count":0,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/1693910\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media\/1693911"}],"wp:attachment":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media?parent=1693910"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/categories?post=1693910"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/tags?post=1693910"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}