
El escritor es analista de tecnología.
La tecnología está llena de narrativas, pero una de las más ruidosas y persistentes se refiere a la inteligencia artificial y algo llamado “datos”.
La IA es el futuro, se nos dice, y se trata de datos, y los datos son el futuro, y deberíamos poseerlos y tal vez recibir un pago por ellos. Y los países también necesitan estrategias de datos y soberanía de datos. Los datos son el nuevo petróleo.
Esto es en su mayoría una tontería. No existen los “datos”, no valen nada y, de todos modos, no te pertenecen.
Lo más obvio es que los datos no son una sola cosa, sino innumerables colecciones diferentes de información, cada una de ellas específica para una aplicación en particular, que no se puede usar para nada más.
Por ejemplo, Siemens tiene telemetría de turbinas eólicas y Transport for London tiene pases de boletos, y esos no son intercambiables. No puede usar la telemetría de la turbina para planificar una nueva ruta de autobús, y si proporcionó ambos conjuntos de datos a Google o Tencent, eso no los ayudaría a construir un mejor sistema de reconocimiento de imágenes.
Esto puede parecer trivial dicho sin rodeos, pero apunta a la inutilidad de afirmaciones muy comunes como “China tiene más datos”, ¿más de qué datos? Meituan entrega 50 millones de pedidos de restaurantes al día, y eso le permite construir un algoritmo de enrutamiento más eficiente, pero no puede usar eso para un sistema de guía de misiles. Ni siquiera puedes usarlo para crear entregas en restaurantes en Londres. Los “datos” no existen, simplemente hay muchos conjuntos de datos.
Por supuesto, cuando las personas hablan de datos, en su mayoría se refieren a “sus” datos: su información y las cosas que hace en Internet, algunas de las cuales son filtradas, agregadas e implementadas por empresas de tecnología. Queremos más controles de privacidad, pero también creemos que deberíamos tener la propiedad de esos datos, donde sea que estén.
El problema es que la mayor parte del significado de “sus” datos no está en usted sino en todas las interacciones con otras personas. Lo que publicas en Instagram significa muy poco: la señal está en a quién le gustaron tus publicaciones y qué más les gustó, en lo que te gustó y a quién más le gustó, y en quién te sigue, a quién más siguen y quién los sigue, y así hacia el exterior en una malla de interacciones entre millones de personas.
Si me gusta su imagen, eso no es “mis” datos o “sus” datos solamente, y no vale nada sin ese contexto. No puedes llevártelo contigo porque en realidad no te pertenece, e incluso si lo tuvieras, no podrías conectarlo a TikTok, porque TikTok tiene una malla completamente diferente.
Esto llevó a mi amigo, el gurú tecnológico Tim O’Reilly, a decir: “Los datos no son el nuevo petróleo. Es arena. Los datos son valiosos solo en la suma de millones. De hecho, esto puede ser cierto incluso sobre la base de un flujo de caja simple. Por ejemplo, en el primer trimestre de 2022, Meta obtuvo solo 99 centavos de flujo de caja libre por usuario activo diario por mes.
Esto se aplica incluso a los datos en los que puede decir de manera significativa que son suyos. Su uso de electricidad no se trata de otras personas, pero no es valioso por sí mismo, solo en el agregado de todo el uso doméstico de electricidad en el sur de Londres o Brooklyn, o donde sea. Y, de nuevo, los datos no son intercambiables: una empresa de energía eléctrica necesita estos datos, pero no sirven para LinkedIn.
De hecho, para muchos de estos sistemas, el valor no está en absoluto en los datos, sino en el flujo de actividad que los rodea: el significado no está en la imagen o el video que publica, sino en cómo reacciona la red mañana. Podría ver a TikTok o PageRank como grandes “turcos mecánicos”: todavía no tenemos una IA que pueda entender qué es cada página, imagen o video en sí mismos, por lo que necesitamos humanos, todos nosotros, en el circuito en algún lugar, en el punto correcto de apalancamiento, me gusta, vincular, hacer clic y mirar. Estos son sistemas, no datos, y el valor está en el flujo.
Hemos estado aquí antes: la IA de hoy se parece mucho a las bases de datos de la década de 1980. Ambas tecnologías transforman lo que podemos hacer con la información y qué preguntas podemos hacer, y cómo pueden funcionar las organizaciones.
Cuando las bases de datos eran nuevas, nos preocupábamos, tal como lo hacemos ahora con la IA. Algunas de esas preocupaciones eran reales, pero hoy nadie pregunta si Estados Unidos tiene más bases de datos o si importa que SAP sea alemán. Nadie en Davos habla de “colonialismo SQL”.
Estas tecnologías no son activos estratégicos, cualquiera puede tenerlas, pero ¿para qué? Las bases de datos habilitaron las cadenas de suministro justo a tiempo y Walmart, y permitieron que Apple fabricara iPhones en China: esas son las preguntas estratégicas. Lo mismo es cierto para la IA y los datos. No es el aceite nuevo, solo más software. La verdadera pregunta es qué construyes con él.

