Databricks compra la startup Tabular, impulsada por el frenesí de la IA


Martes 4 de junio, proveedor de soluciones de análisis y procesamiento de datos Databricks, ha anunciado la adquisición de la joven empresa Tabular. La transacción supera los mil millones de dólares según el Wall Street Journal. Debería permitir a Databricks atraer nuevos clientes que quieran gestionar inmensas cantidades de datos utilizando inteligencia artificial (IA).

Tabular, la redención lógica

Tabular es un proveedor de plataforma de almacenamiento creado en 2021 por los padres del formato de tabla de código abierto Apache Iceberg. Su objetivo: facilitar la interoperabilidad de los datos en los lagos de datos.

Apache Iceberg es bastante conocido en el mundo de las tecnologías de la información. Cada vez más popular en los últimos años, fue desarrollado por una determinada empresa llamada Netflix. Tabular ahora ofrece herramientas de gestión de datos basadas en Iceberg. Aunque reciente, todavía recaudó 37 millones de dólares en septiembre de 2023.

En cuanto a Databricks, esta adquisición es otra señal de que continúa su impresionante ascenso. En septiembre, este especialista en gestión de datos fundado en 2013 logró recaudar la friolera de 500 millones de dólares.

Su valoración alcanzó entonces los 43.000 millones de dólares, con grandes nombres entre sus inversores, incluida Nvidia. En 2021, recaudó 2.600 millones. Su principio es simple, pero efectivo: ofrecer análisis, inteligencia artificial y varios software en la nube en torno a la gestión de datos.

Soluciones para empresas que buscan hacer un buen uso de sus datos. Su éxito se debe en parte a su anticipación. Muy rápidamente, la empresa se centró en la IA, mucho antes de que se convirtiera en la tecnología más popular.

Databricks se basa en data lakehouse. Esta arquitectura combina tecnología de lago de datos y almacén de datos. Este último representa el clásico almacenamiento de información de la mayoría de empresas. El lago de datos permite procesar inmensas cantidades de datos necesarios tan pronto como existe IA.

Permite almacenar datos a bajo coste en formatos abiertos. Para estructurar más esta tecnología, el lago de datos se mezcló con el almacén de datos, creando así el lago de datos. Concretamente para las empresas, esto representa un ahorro de dinero y un mejor uso de las herramientas de IA.

En el mundo de los lagos de datos, Databricks ha creado su “formato”, el Delta Lake. Apache Iceberg se ha convertido en uno de sus competidores, a pesar de algunas diferencias. Por tanto, las dos soluciones pueden resultar complementarias.

Databricks quiere competir con Snowflake

Iceberg y Delta Lake pueden fusionarse en el futuro. “ Queremos crear la mejor plataforma de gestión de datos basada en formatos abiertos de Lakehouse para que las empresas no tengan que preocuparse por elegir el formato “correcto” o quedar atrapadas en formatos de datos propietarios. “, declaró con razón Ryan Blue, cofundador de Tabular.

Agregó que “ Nuestro objetivo es mejorar la interoperabilidad para que puedas disfrutar del increíble trabajo de ambas comunidades sin tener que preocuparte por el formato subyacente. “. En 2024, uno de los mayores competidores es la startup de alojamiento de datos en la nube Snowflake.

Esta adquisición podría ayudar a Databricks a lanzar nuevos productos más rápidamente y obtener una ventaja en la batalla de formatos en Iceberg. Incorporar a Tabular le permitirá centrarse en las mesas Iceberg y, tal vez, robarle clientes a Snowflake.

Snowflake no tiene intención de dejar que esto suceda, ya que el martes anunció la llegada de futuras herramientas para ayudar a los clientes que utilicen Iceberg. Desde la aparición de la IA generativa, las dos empresas han librado una feroz batalla en este segmento. Snowflake ha realizado varias adquisiciones en los últimos años. Los más recientes son los de TruEra y Neeva. Para Databricks, esta ya es su tercera adquisición en un año.

Se espera que la transacción se cierre el 31 de julio. Los 40 empleados de Tabular se unirán a las filas de Databricks en esta ocasión.



ttn-es-4