{"id":1664663,"date":"2025-04-11T04:56:05","date_gmt":"2025-04-11T04:56:05","guid":{"rendered":"https:\/\/teknomers.com\/es\/tiempo-de-prueba-de-seguridad-del-modelo-de-ai-de-openai-slashes-ai\/"},"modified":"2025-04-11T04:56:10","modified_gmt":"2025-04-11T04:56:10","slug":"tiempo-de-prueba-de-seguridad-del-modelo-de-ai-de-openai-slashes-ai","status":"publish","type":"post","link":"https:\/\/teknomers.com\/es\/tiempo-de-prueba-de-seguridad-del-modelo-de-ai-de-openai-slashes-ai\/","title":{"rendered":"Tiempo de prueba de seguridad del modelo de AI de OpenAI Slashes AI"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div id=\"article-body\">\n<p>Operai ha reducido el tiempo y los recursos que gasta para probar la seguridad de sus poderosos modelos de inteligencia artificial, lo que aumenta las preocupaciones de que su tecnolog\u00eda se est\u00e1 apresurando sin suficientes salvaguardas.<\/p>\n<p>El personal y los grupos de terceros han recibido recientemente solo d\u00edas para realizar &#8220;evaluaciones&#8221;, el t\u00e9rmino otorgado a las pruebas para evaluar los riesgos y el rendimiento de los modelos, en los \u00faltimos modelos de idiomas de OpenAI, en comparaci\u00f3n con varios meses antes.<\/p>\n<p>Seg\u00fan ocho personas familiarizadas con los procesos de prueba de OpenAI, las pruebas de la nueva empresa se han vuelto menos exhaustivas, con un tiempo y recursos insuficientes dedicados a identificar y mitigar los riesgos, ya que la nueva empresa de $ 300 mil millones se presiona para liberar nuevos modelos r\u00e1pidamente y retener su ventaja competitiva. <\/p>\n<p>\u201cTuvimos pruebas de seguridad m\u00e1s exhaustivas cuando [the technology] fue menos importante &#8220;, dijo una persona que actualmente prob\u00f3 el pr\u00f3ximo modelo O3 de OpenAI, dise\u00f1ado para tareas complejas, como la resoluci\u00f3n de problemas y el razonamiento.<\/p>\n<p>Agregaron que a medida que los LLM se vuelven m\u00e1s capaces, se incrementa la &#8220;arma potencial&#8221; de la tecnolog\u00eda. &#8220;Pero debido a que hay m\u00e1s demanda, lo quieren m\u00e1s r\u00e1pido. Espero que no sea un mal paso catastr\u00f3fico, pero es imprudente. Esta es una receta para el desastre&#8221;.<\/p>\n<p>El Time Crunch ha sido impulsado por &#8220;presiones competitivas&#8221;, seg\u00fan personas familiarizadas con el asunto, ya que las carreras de Operai contra grandes grupos tecnol\u00f3gicos como Meta y Google y nuevas empresas, incluida la Xai de Elon Musk, para sacar provecho de la tecnolog\u00eda de vanguardia.<\/p>\n<p>No existe un est\u00e1ndar global para las pruebas de seguridad de la IA, pero a finales de este a\u00f1o, la Ley de IA de la UE obligar\u00e1 a las empresas a realizar pruebas de seguridad en sus modelos m\u00e1s poderosos. Anteriormente, los grupos de inteligencia artificial, incluido OpenAI, han firmado compromisos voluntarios con gobiernos en el Reino Unido y los Estados Unidos para permitir a los investigadores de los Institutos de Seguridad de AI evaluar los modelos.<\/p>\n<p>Operai ha estado presionando para lanzar su nuevo Modelo O3 a partir de la pr\u00f3xima semana, dando menos de una semana a algunos evaluadores por sus controles de seguridad, seg\u00fan personas familiarizadas con el asunto. Esta fecha de lanzamiento podr\u00eda estar sujeta a cambios.<\/p>\n<p>Anteriormente, Openai permiti\u00f3 varios meses para pruebas de seguridad. Para GPT-4, que se lanz\u00f3 en 2023, los evaluadores tuvieron seis meses para realizar evaluaciones antes de ser liberadas, seg\u00fan personas familiarizadas con el asunto.<\/p>\n<p>Una persona que hab\u00eda probado GPT-4 dijo que algunas capacidades peligrosas solo se descubrieron dos meses en las pruebas. &#8220;Simplemente no est\u00e1n priorizando la seguridad p\u00fablica en absoluto&#8221;, dijeron sobre el enfoque actual de Operai.<\/p>\n<p>&#8220;No hay regulaci\u00f3n que dice [companies] Tengo que mantener al p\u00fablico informado sobre todas las capacidades de miedo. . . Y tambi\u00e9n est\u00e1n bajo mucha presi\u00f3n para competir entre s\u00ed, por lo que no van a dejar de hacerlos m\u00e1s capaces &#8220;, dijo Daniel Kokotajlo, un ex investigador de OpenAi que ahora lidera el Proyecto de Futuros del Grupo AI sin fines de lucro.<\/p>\n<p>Operai se ha comprometido previamente a construir versiones personalizadas de sus modelos para evaluar el mal uso potencial, como si su tecnolog\u00eda podr\u00eda ayudar a que un virus biol\u00f3gico sea m\u00e1s transmisible.<\/p>\n<p>El enfoque implica recursos considerables, como ensamblar conjuntos de datos de informaci\u00f3n especializada como virolog\u00eda y alimentarlo al modelo para entrenarlo en una t\u00e9cnica llamada ajuste fino.<\/p>\n<p>Pero Operai solo ha hecho esto de una manera limitada, optando por ajustar un modelo m\u00e1s antiguo y menos capaz en lugar de los m\u00e1s potentes y avanzados. <\/p>\n<p>El informe de seguridad y rendimiento de la nueva empresa sobre O3-Mini, su modelo m\u00e1s peque\u00f1o publicado en enero, hace referencia a c\u00f3mo su modelo anterior GPT-4O pudo realizar una cierta tarea biol\u00f3gica solo cuando se ajustaba. Sin embargo, Operai nunca ha informado c\u00f3mo sus modelos m\u00e1s nuevos, como O1 y O3-Mini, tambi\u00e9n obtendr\u00edan un puntaje si se ajustan. <\/p>\n<p>&#8220;Es excelente Operai establece una barra tan alta al comprometerse a probar versiones personalizadas de sus modelos. Pero si no est\u00e1 siguiendo este compromiso, el p\u00fablico merece saber&#8221;, dijo Steven Adler, un ex investigador de seguridad de Operai, que ha escrito un blog sobre este tema.<\/p>\n<p>&#8220;No hacer tales pruebas podr\u00eda significar Openai y las otras compa\u00f1\u00edas de IA est\u00e1n subestimando los peores riesgos de sus modelos&#8221;, agreg\u00f3.<\/p>\n<p>Las personas familiarizadas con tales pruebas dijeron que ten\u00edan costos fuertes, como contratar expertos externos, crear conjuntos de datos espec\u00edficos, as\u00ed como usar ingenieros internos y energ\u00eda inform\u00e1tica. <\/p>\n<p>Operai dijo que hab\u00eda hecho eficiencias en sus procesos de evaluaci\u00f3n, incluidas las pruebas automatizadas, lo que ha llevado a una reducci\u00f3n en los plazos. Agreg\u00f3 que no hab\u00eda una receta acordada para enfoques como el ajuste fino, pero estaba seguro de que sus m\u00e9todos eran los mejores que pod\u00eda hacer y se hicieron transparentes en sus informes. <\/p>\n<p>Agreg\u00f3 que los modelos, especialmente para los riesgos catastr\u00f3ficos, se probaron y mitigaron a fondo por seguridad.<\/p>\n<aside aria-labelledby=\"aside-label\" class=\"n-content-recommended--single-story n-content-recommended--inset\" data-component=\"recommended\">\n<p class=\"n-content-recommended__title\">Recomendado<\/p>\n<div class=\"o-teaser o-teaser--article o-teaser--small o-teaser--stacked o-teaser--has-image js-teaser\" data-id=\"36b522d4-7ea2-42bc-8573-84f68c3a4323\">\n<div class=\"o-teaser__image-container js-teaser-image-container\">\n<div class=\"o-teaser__image-placeholder\" style=\"aspect-ratio:2493\/1402\"><\/div>\n<\/div>\n<\/div>\n<\/aside>\n<p>&#8220;Tenemos un buen equilibrio de lo r\u00e1pido que nos movemos y lo minuciosos que somos&#8221;, dijo Johannes Heidecke, jefe de sistemas de seguridad.<\/p>\n<p>Otra preocupaci\u00f3n planteada fue que las pruebas de seguridad a menudo no se realizan en los modelos finales lanzados al p\u00fablico. En cambio, se realizan en puntos de control anteriores que luego se actualizan para mejorar el rendimiento y las capacidades, con versiones &#8220;cercanas&#8221; a las que se hace referencia en los informes de seguridad del sistema de OpenAI.<\/p>\n<p>&#8220;Es una mala pr\u00e1ctica lanzar un modelo que sea diferente del que evalu\u00f3&#8221;, dijo un ex miembro del personal t\u00e9cnico de Operai.<\/p>\n<p>Operai dijo que los puntos de control eran &#8220;b\u00e1sicamente id\u00e9nticos&#8221; a lo que se lanz\u00f3 al final.<\/p>\n<\/div>\n<p><br \/>\n<br \/><a href=\"https:\/\/www.ft.com\/content\/8253b66e-ade7-4d1f-993b-2d0779c7e7d8\" rel=\"nofollow noopener\" target=\"_blank\">ttn-es-56<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Operai ha reducido el tiempo y los recursos que gasta para probar la seguridad de sus poderosos modelos<\/p>\n","protected":false},"author":1,"featured_media":1664664,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[38,2832,83672,695,42,283584,448],"class_list":["post-1664663","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-general","tag-del","tag-modelo","tag-openai","tag-prueba","tag-seguridad","tag-slashes","tag-tiempo"],"_links":{"self":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/1664663","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/comments?post=1664663"}],"version-history":[{"count":0,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/1664663\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media\/1664664"}],"wp:attachment":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media?parent=1664663"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/categories?post=1664663"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/tags?post=1664663"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}