
L’IA que Crea L’IA: El Nuevo Mémo de Anthropic y Su Impacto en el Mundo Tecnológico
Un Hito en la Investigación de IA
Recientemente, Anthropic ha revelado los impresionantes resultados de un proyecto de investigación llevado a cabo completamente por sus agentes, conocidos como Claude. Este avance se centró en un problema abierto de seguridad en inteligencia artificial, donde dos investigadores humanos lograron un notable 23% de mejora en una semana al comparar un supervisor débil con un modelo fuerte entrenado para proporcionar respuestas correctas.
Eficiencia Mejorada
En total, el esfuerzo requirió aproximadamente 800 horas de cálculo, equivalentes a cerca de 16,300 euros, logrando así un impresionante 97% en efectividad. Mientras que los humanos definieron el problema y los criterios, fueron los agentes los que idearon y ejecutaron cada experimento, marcando un cambio significativo en la dinámica de investigación.
Revolución en la Optimización del Código
Para mayo de 2025, el agente Claude Opus 4 había multiplicado por tres la velocidad del código base, una cifra que se elevó a 52 con la reciente versión Mythos Preview. Para poner esto en perspectiva, un desarrollador humano competente puede aumentar la eficiencia del código en un máximo de cuatro veces en un período de cuatro a ocho horas.
Efecto en la Organización del Trabajo
Este incremento de velocidad plantea importantes desafíos para la organización laboral dentro de Anthropic. La producción de código por parte de Claude supera la capacidad de revisión por parte de los ingenieros, creando un cuello de botella donde la relectura humana ahora retrasa todo el proceso de desarrollo.
Autonomía en la Corrección de Errores
Además, los agentes de Claude han demostrado su capacidad para corregir más de 800 errores de API de manera autónoma, disminuyendo la clasificación de incidentes en un factor de mil. Un ingeniero interno estima que un humano habría necesitado cuatro años para lograr lo mismo.
Miradas al Futuro
A pesar de estos avances, investigadores como Marina Favaro y Jack Clark sugieren que el camino hacia adelante podría variar. La capacidad de los modelos podría estancarse, y las herramientas actuales podrían integrarse en la economía sin romper nuevos umbrales de innovación. La supervisión humana podría continuar guiando las orientaciones de investigación mientras la ejecución del proyecto se automatiza aún más.
Desafíos en Seguridad: Project Glasswing
Un aspecto destacado de la reciente investigación es el Project Glasswing, donde Mythos Preview logró identificar más de diez mil vulnerabilidades críticas en pocas semanas, incluyendo un bug que había estado presente en OpenBSD durante 27 años. Este logro subraya la eficiencia de estos agentes en la detección de problemas de seguridad que han permanecido ocultos por tanto tiempo.
Conclusión
El informe de Anthropic marca un punto de inflexión en la forma en que se concibe y ejecuta la investigación en inteligencia artificial. A medida que estos sistemas continúan evolucionando, el impacto en el trabajo humano, la seguridad y la estructura misma de la investigación tecnológica será profundo y duradero. A medida que avanzamos, será crucial observar cómo se desarrollan estos cambios y cómo influirán en el futuro de la tecnología.




