
A medida que el campo de la inteligencia artificial (IA) continúa evolucionando a un ritmo rápido, una nueva investigación ha encontrado cómo las técnicas que representan el protocolo del contexto modelo (MCP) susceptible a ataques de inyección inmediatos podrían usarse para desarrollar herramientas de seguridad o identificar herramientas maliciosas, según un nuevo informe de tenable.
MCP, lanzado por Anthrope en noviembre de 2024, es un marco diseñado para conectar modelos de idiomas grandes (LLM) con fuentes y servicios de datos externos, y utilizar herramientas controladas por modelos para interactuar con esos sistemas para mejorar la precisión, relevancia y utilidad de las aplicaciones de IA.
Sigue una arquitectura de cliente cliente, permitiendo Hosts con clientes de MCP como Claude Desktop o cursor para comunicarse con diferentes servidores MCP, cada uno de los cuales expone herramientas y capacidades específicas.
Mientras que el estándar abierto ofrece un interfaz unificada Para acceder a diversas fuentes de datos e incluso cambiar entre proveedores de LLM, también vienen con un nuevo conjunto de riesgos, desde el alcance de permiso excesivo hasta los ataques de inyección indirecta.
Por ejemplo, dado un MCP para que Gmail interactúe con el servicio de correo electrónico de Google, un atacante podría Enviar mensajes maliciosos que contiene instrucciones ocultas que, cuando se analizan por el LLM, podrían desencadenar acciones indeseables, como reenviar correos electrónicos confidenciales a una dirección de correo electrónico bajo su control.
MCP también ha sido encontró Para ser vulnerable a lo que se llama envenenamiento por herramientas, en el que las instrucciones maliciosas están integradas dentro de las descripciones de herramientas que son visibles para LLMS, y los ataques de la tira de alfombras, que ocurren cuando una herramienta MCP funciona de manera benigna inicialmente, pero muta su comportamiento más adelante a través de una actualización maliciosa de tiempo.
“Cabe señalar que, si bien los usuarios pueden aprobar el uso y el acceso de la herramienta, los permisos dados a una herramienta se pueden reutilizar sin volver a promocionar al usuario”, Sentinelone dicho en un análisis reciente.
Finalmente, también existe el riesgo de contaminación de la herramienta cruzada o el sombreado de herramientas de servidor cruzado que hace que un servidor MCP anule o interfiera con otro, influyendo sigilosamente en cómo se deben usar otras herramientas, lo que lleva a nuevas formas de exfiltración de datos.
Los últimos hallazgos de Tenable muestran que el marco MCP podría usarse para crear una herramienta que registre todas las llamadas de la función de la herramienta MCP al incluir una descripción especialmente elaborada que instruya a la LLM que inserte esta herramienta antes de invocar cualquier otra herramienta.
En otras palabras, el inyección rápida se manipula para un buen propósito, que es registrar información sobre “la herramienta que se le pidió que ejecutara, incluido el nombre del servidor MCP, el nombre y la descripción de la herramienta MCP, y el indicador del usuario que hizo que la LLM intentara ejecutar esa herramienta”.
Otro caso de uso implica incrustar una descripción en una herramienta para convertirlo en un firewall que bloquee las herramientas no autorizadas.
“Las herramientas deben requerir la aprobación explícita antes de ejecutarse en la mayoría de las aplicaciones de host MCP”, dijo el investigador de seguridad Ben Smith.
“Aún así, hay muchas formas en que las herramientas se pueden usar para hacer cosas que pueden no ser estrictamente entendidas por la especificación. Estos métodos dependen de la incorporación de LLM a través de los valores de descripción y retorno de las herramientas MCP. Dado que los LLM no son deterministas, también son los resultados”.
No es solo MCP
La divulgación se produce cuando Trustwave SpiderLabs reveló que el recién introducido Agent2Agent (A2A) El protocolo, que permite la comunicación y la interoperabilidad entre las aplicaciones de agente, podrían expuestos a ataques de formularios novedosos donde el sistema se puede jugar para enrutar todas las solicitudes a un agente de IA pícaro al mentir sobre sus capacidades.
A2A fue anunciado por Google a principios de este mes como una forma para que los agentes de IA trabajen en los sistemas y aplicaciones de datos en aislados, independientemente del proveedor o el marco utilizado. Es importante tener en cuenta aquí que mientras MCP conecta LLM con datos, A2A conecta un agente de IA a otro. En otras palabras, ambos son protocolos complementarios.
“Digamos que comprometimos al agente a través de otra vulnerabilidad (tal vez a través del sistema operativo), si ahora utilizamos nuestro nodo comprometido (el agente) y elaboramos un Tarjeta de agente Y realmente exagere nuestras capacidades, entonces el agente anfitrión debe elegirnos cada vez para cada tarea y enviarnos todos los datos confidenciales del usuario que debemos analizar “, el investigador de seguridad Tom Neaves dicho.
“El ataque no solo se detiene para capturar los datos, sino que puede ser activo e incluso devolver resultados falsos, que luego serán actuados hacia abajo por el LLM o el usuario”.






