{"id":395420,"date":"2022-09-27T14:07:17","date_gmt":"2022-09-27T14:07:17","guid":{"rendered":"https:\/\/teknomers.com\/es\/whisper-el-sistema-de-reconocimiento-de-voz-de-openai-se-convierte-en-codigo-abierto\/"},"modified":"2022-09-27T14:07:19","modified_gmt":"2022-09-27T14:07:19","slug":"whisper-el-sistema-de-reconocimiento-de-voz-de-openai-se-convierte-en-codigo-abierto","status":"publish","type":"post","link":"https:\/\/teknomers.com\/es\/whisper-el-sistema-de-reconocimiento-de-voz-de-openai-se-convierte-en-codigo-abierto\/","title":{"rendered":"Whisper, el sistema de reconocimiento de voz de OpenAI, se convierte en c\u00f3digo abierto"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div>\n<p>Whisper, el sistema de reconocimiento de voz multiling\u00fce desarrollado y potenciado por OpenAI, una empresa especializada en inteligencia artificial, obtuvo una licencia gratuita el 22 de septiembre de 2022. Todo el c\u00f3digo que permite el funcionamiento de esta herramienta, as\u00ed como las explicaciones asociadas, se han publicado en <a rel=\"nofollow noopener\" href=\"http:\/\/github.com\/openai\/whisper\" target=\"_blank\">GitHub<\/a> y por lo tanto son de libre acceso y gratuitas.<\/p>\n<h2>Whisper OpenAI, uno de los modelos de reconocimiento de voz m\u00e1s avanzados del mundo<\/h2>\n<p>Whisper es un modelo de reconocimiento de voz dise\u00f1ado por OpenAI.  Se sabe que el marco es el origen del modelo de lenguaje GPT-3, que es uno de los m\u00e1s proporcionados y utilizados en el mundo con 175 mil millones de par\u00e1metros.  Es ella tambi\u00e9n quien est\u00e1 en el origen del modelo de inteligencia artificial DALL-E 2 que permite crear im\u00e1genes a partir de descripciones textuales.<\/p>\n<div class=\"alignfull-content\">\n<span class=\"purpley-grey\">En la misma categor\u00eda<\/span><\/p>\n<article class=\"grid-box anim col-12 post default post-read-also\">\n<div class=\"image\">\n<img decoding=\"async\" width=\"190\" height=\"190\" src=\"https:\/\/teknomers.com\/es\/wp-content\/uploads\/2022\/09\/Whisper-el-sistema-de-reconocimiento-de-voz-de-OpenAI-se.jpg\" class=\"attachment-post-ligne size-post-ligne wp-post-image\" alt=\"Logotipo de Alibaba.\" loading=\"lazy\" \/> <\/div>\n<div class=\"content\">\n<h2>Alibaba abre dos laboratorios de inteligencia artificial<\/h2>\n<\/div>\n<\/article>\n<\/div>\n<p>Entrenado usando 680.000 horas de datos multitarea y multiling\u00fces, Whisper puede transcribir cada palabra de un individuo casi instant\u00e1neamente.  A\u00fan m\u00e1s impresionante: puede traducir estas palabras a una gran cantidad de idiomas, incluido el franc\u00e9s.  Gracias a este entrenamiento, el sistema es capaz de identificar las m\u00faltiples particularidades de una decena de idiomas, pero tambi\u00e9n los acentos, los sonidos de fondo e incluso palabras muy t\u00e9cnicas, poco utilizadas en un idioma.<\/p>\n<p>La herramienta puede ser utilizada por particulares para traducir autom\u00e1ticamente una pel\u00edcula, una serie, un videoclip o un documental, por ejemplo.  Para los investigadores de IA, sirve como base para comprender mejor las facetas del reconocimiento de voz y, por lo tanto, perfeccionar el modelo, o incluso crear uno mejor.<\/p>\n<h2>\u00bfPor qu\u00e9 Whisper OpenAI se convirti\u00f3 en c\u00f3digo abierto?<\/h2>\n<p>De acuerdo a <a rel=\"nofollow noopener\" href=\"https:\/\/techcrunch.com\/2022\/09\/21\/openai-open-sources-whisper-a-multilingual-speech-recognition-system\/\" target=\"_blank\"><em>TechCrunch<\/em><\/a>, el paso de Whisper en una versi\u00f3n de c\u00f3digo abierto permitir\u00e1 a los especialistas en inteligencia artificial, que no necesariamente est\u00e1n afiliados a un laboratorio o instituto, avanzar en la investigaci\u00f3n en el campo del reconocimiento de voz.  La herramienta tiene algunas limitaciones, especialmente en lo que respecta a la predicci\u00f3n.<\/p>\n<p>Para generalizar, Whisper puede incluir palabras en sus transcripciones que en realidad no se pronunciaron.  Esto puede suceder cuando algunas palabras habladas son fon\u00e9ticamente cercanas a otras o cuando una palabra predicha por el sistema funcionar\u00eda bien con la hablada originalmente.  Otra dificultad es que el sistema tiene m\u00e1s dificultades cuando una persona habla en su idioma nativo (que no sea ingl\u00e9s), porque los datos utilizados para entrenar el modelo no incluyen una gran cantidad de hablantes nativos.<\/p>\n<p>Open AI lo ha reconocido a s\u00ed mismo: sus colaboradores ya no tienen tiempo para involucrarse tanto como antes en Whisper, de ah\u00ed el inter\u00e9s en hacerlo de c\u00f3digo abierto para que todos puedan probarlo para mejorar.<\/p>\n<\/div>\n<p><br \/>\n<br \/><a href=\"https:\/\/siecledigital.fr\/2022\/09\/27\/whisper-le-systeme-de-reconnaissance-vocale-dopenai-devient-open-source\/\" rel=\"nofollow noopener\" target=\"_blank\">ttn-es-4<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Whisper, el sistema de reconocimiento de voz multiling\u00fce desarrollado y potenciado por OpenAI, una empresa especializada en inteligencia<\/p>\n","protected":false},"author":1,"featured_media":395421,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[44,706,3386,83672,13205,5321,4791,86302],"class_list":["post-395420","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-general","tag-abierto","tag-codigo","tag-convierte","tag-openai","tag-reconocimiento","tag-sistema","tag-voz","tag-whisper"],"_links":{"self":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/395420","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/comments?post=395420"}],"version-history":[{"count":0,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/395420\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media\/395421"}],"wp:attachment":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media?parent=395420"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/categories?post=395420"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/tags?post=395420"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}