lunes, 9 de junio de 2014

¿La desaparición del Data Warehouse?

El esquema actual de la  Inteligencia de Negocios  ha tenido un rápido crecimiento en los últimos años.  Una de las principales razones es el abaratamiento de la memoria RAM (memoria de acceso aleatorio). Tan sólo en la primera década del siglo XXI, el costo de este tipo de memoria se redujo a un céntimo del precio original. Esto, aunado al súbito incremento de la velocidad de los procesos, ha permitido una optimización en la lectura de la información, ya que el acceso a la memoria es más rápido y se eliminó la necesidad de los índices en las bases de datos y los “aggregates”.

Dado el incremento en  la capacidad de las memorias, los datos se guardan en columnas, en lugar de filas.  La información guardada en columnas se organiza mejor, consume menos espacio y acelera el acceso de lectura de la información.

La evolución de la memoria RAM y el uso de bases de datos columnares han eliminado la necesidad de un Data Warehouse. Muchas de las plataformas actuales de BI hacen el procesamiento de datos directo de memoria, es decir, sin necesidad de hacer consultas a los grandes almacenes de datos. Esto no significa su extinción, ya que las  memorias RAM son volátiles y su información desaparece sin energía. Por ello, es necesario contar con un respaldo en discos de la información. La eficiencia  se da por la reducción dramática en el número de consultas y transacciones.

Este procesamiento en memoria, que ya se encuentra embebido en los aplicativos de analítica, hace posible la eliminación de los motores de cálculos analíticos típicos de BI. El procesamiento masivamente paralelo y las capacidades de hardware que se tienen hoy habilitan a los aplicativos poder realizar procesamiento directo sobre la memoria, lo que se traduce en rapidez y eficiencia.

Otro cambio importante se da en la parte del almacenamiento de datos operacionales. Las capacidades antes mencionadas, proveen una mayor velocidad en el procesamiento de información, produciendo un decremento en la latencia de lectura y comunicación de datos y resultados. Dicha velocidad junto con las actualizaciones incrementales eliminan la necesidad de tener el almacenamiento de datos operacionales por separado. Esto nos lleva a un esquema de Inteligencia de Negocios prácticamente en tiempo real.

Definitivamente, las condiciones de hardware y los diseños de software permiten una reducción dramática en la infraestructura requerida para realizar procesos de Inteligencia de Negocios. Sin embargo, no hay que olvidar la importancia de un esquema de gobernanza de datos.


La velocidad con la que se pueden guardar, consultar, procesar y analizar datos no debe eclipsar la necesidad de mecanismos de gobierno de datos. Temas como la integración y calidad de datos, datos maestros, etc., no dejan de ser relevantes y tener una prioridad muy alta en la agenda de TI de cada organización.

No hay comentarios:

Publicar un comentario

Datos personales

Mi foto
Soy un apasionado de la Tecnología, estudiante del Master en Tecnologías de la Información y Administración y gran admirador del Sistema Operativo Linux.