¿Qué es Data Lake y cómo transforma el almacenamiento de datos?

En la era digital, el volumen de información que manejan las empresas y organizaciones es cada vez mayor. Gestionarlo puede ser costoso, pero si no se usa, pierde su valor. La compañía EMC dice tener la solución

Compartir
Compartir articulo
 shutterstock 163
shutterstock 163

"El mayor desafío que las organizaciones enfrentan hoy en día es cómo manejar la explosión de crecimiento de los datos", asegura a Infobae Alfredo Meneses, vocero de Big Data - Greenplum para México y el norte de América Latina de EMC. No es para menos. En la era digital, los datos están por doquier y se multiplican por segundo. La información es valiosa y, ante ese volumen en expansión, el problema es cómo organizarla para aprovecharla al máximo y no desperdiciarla.

Es, en ese sentido, que se acuñan los términos "Big Data" y "Data Lake". Los "lagos de datos" son repositorios donde se guarda la información de manera plana, sin ser tabulada o clasificada. Se están volviendo populares como catálogos altamente escalables de confianza para almacenar información de una amplia variedad de orígenes, de acuerdo con EMC.

Los datos son vertidos por las organizaciones y recuperados cuando es necesario. Solo en ese instante se les da un orden y una estructura que permita su posterior análisis. Se complementa con la idea de un edificio que se construye en base a la información; del Data Lake se obtienen los materiales.

Allí entra en juego el primer concepto, Big Data, que hace referencia a la estructura donde son almacenados esos grandes volúmenes de datos. A partir del análisis de la información, es posible trazar una política pública, delinear una estrategia de marketing e incluso predecir la evolución de una enfermedad en la población.

Con los historiales de sus pacientes, por ejemplo, un centro médico puede encontrar un patrón de contagio de una determinada enfermedad, como la gripe, o los momentos de mayores brotes. Lo mismo una marca de ropa al leer las preferencias de sus consumidores para saber cuáles son los productos y estilos favoritos o cuándo hay una baja en las compras que se podría reforzar con promociones.

 shutterstock 163
shutterstock 163

"El primer paso para construir una arquitectura de negocios Data Lake y convertirse en una empresa basada en datos es el almacenamiento y archivo de todos los tipos de datos de forma indefinida", aconseja Meneses. "Esto es difícil y costoso con los enfoques tradicionales", agrega.

Existen distintas compañías que ofrecen los servicios de "lago de datos", que son una forma de abaratar costos, dado que la información es procesada solo cuando es requerida. Datalakes es una de ellas. EMC ofrece, por su parte, Pivotal Big Data Suite, uno de los protagonistas del megalaunch que hizo la compañía en Londres a principios de julio.

De acuerdo con Meneses, el servicio de Pivotal permite guardar la información, analizarla, determinar su valor e identificar si pueden o no existir correlaciones entre los diferentes conjuntos de datos y tipos. Además, las empresas u organizaciones pagan por lo que se analiza, no por lo que se almacena.

Los datos son estratégicos, lo que significa que, para sostener un negocio o lograr que una política o campaña de interés público sea exitosa, es clave tener una adecuada estructura con la que comprender su contenido y aplicarlo en la toma de decisiones. Si en la era digital, los datos se producen y se reproducen, las organizaciones modernas necesitan adaptarse para que también sean útiles a su propio interés y al de ciudadanos y consumidores.