Cloudera presenta su nuevo data lakehouse


Cloudera, start-up americana especializada en el desarrollo de software relacionado con big data, ha anunciado el lanzamiento de su nueva solución Cloudera Data Platform One o CDP One. Si ya existía desde 2019, la firma ofrece una nueva versión con la llegada de novedades con el objetivo de ofrecer una herramienta para unificar la gestión de datos.

CDP One: la nueva versión del lago de datos de Cloudera

CDP One es el nuevo lago de datos propuesto por Cloudera. Más generalmente, es una solución para almacenar datos en la nube tomando ciertas características de los almacenes de datos, lagos de datos, que tenían el principio de almacenar datos de un sistema de información de tal manera que solo se retienen los datos relevantes. Viene a ponerse en competencia directa con empresas como Snowflake, ya muy consolidadas en el mercado.

En la misma categoría

TV y computadora con aplicaciones de transmisión.

Francia, Italia y España quieren que GAFAM financie redes de telecomunicaciones

Esta herramienta es el resultado de la fusión de las soluciones de Cloudera y Hortonworks, empresa adquirida por Cloudera en 2018. Combina almacenamiento de datos, aprendizaje automático y análisis para almacenar los datos de una empresa en la nube. Actualmente, CDP One solo está disponible en AWS y no ofrece una opción para sus principales competidores, Google Cloud o Microsoft Azure.

Si bien CDP One actualmente solo está disponible en un servicio en la nube, Ram Venkatesh, CTO de Cloudera, reconoce la importancia de que su herramienta pueda admitir la implementación en múltiples servicios en la nube. Este deseo es el siguiente paso para mejorar el lago de datos. El CTO le dice a TechCrunch que actualmente, El motor subyacente de CDP One sería totalmente compatible con AWS, Azure y GCP «.

¿Qué funciones ofrece CDP One?

Según Cloudera, CDP One es una oferta SaaS de lago de datos todo en uno. Según Ram Venkatesh, su objetivo es » permitir que todos en una empresa obtengan la información en tiempo real que necesitan para tomar las decisiones correctas, lo que requiere construir una arquitectura de datos verdaderamente moderna en la nube «.

La plataforma permite integrar, preparar, analizar y publicar datos en las aplicaciones objetivo de la empresa. Pone así a disposición un conjunto de herramientas de código abierto como NiFi, Apache Spark, Hive, Impala, YARN, Flask o Streamlit. Cada procesamiento de datos se puede codificar desde un cuaderno o mediante una interfaz sin código de bajo código que le permite codificar en SQL, R, Scala o Python.

Cloudera también ha hecho hincapié en la seguridad de los datos de sus usuarios. Como señala el CTO de la firma, » Cloudera es responsable de almacenar y administrar datos con CDP One. Ya no solo permitimos el procesamiento de datos. Esto significa que debemos ser conscientes de dónde residen los datos y de las consideraciones regionales de privacidad de datos. »

Esta nueva solución propuesta por Cloudera competirá con varias ofertas ya presentes en el mercado como Big Lake de Google o la de Databricks.



ttn-es-4