Diferencias entre BI y Big Data

En este post aclararé las diferencias entre el BI y Big Data. También me centraré en explicar en como ambos analizan los datos, tanto en las formas como en el modo de analizar estos recursos y explicaré cual esta siendo la tendencia en analizar datos (si esta creciendo mas analizar datos estructurados o datos no estructurados).

BI vs Big Data

Si bien tanto Business Intelligence como Big Data son dos tecnologías que ayudan en el análisis de datos para la toma de decisiones en las empresas, existen diferencias entre ellas muy palpables tanto en las formas como en el modo, incluso en el tipo de datos analizados.

Tradicionalmente la forma de operar en el Business Intelligence es a través de la agrupación de todos los datos, que una empresa posea, en una única Base de Datos alojada en un único servidor central. A este entorno de almacenamiento de los datos se le conoce como Data Warehouse, como veíamos anteriormente. Una de sus ventajas es la posibilidad de visualizar los datos en modo off-line, sin necesidad de tener que estar conectados a internet.

Por contra, la tecnología de Big Data plantea un entorno en el que los datos se almacenan en un sistema de ficheros distribuido en lugar de en un servidor central. La lectura de los mismos es más compleja, pero por otro lado se trata de un entorno más seguro así como también más flexible.

Otra de las diferencias esenciales entre ambas tecnologías es el modo en el que cada una se centra en la forma de analizar los datos. Si bien el BI lleva los datos a las funciones de proceso, el Big Data hace lo contrario, centrando el análisis en torno al dato.

En este sentido, esta manera de actuar de una tecnología u otra tiene su base en la manera en la que cada una estructura sus datos.

Si bien en el BI los datos se estructuran en una base de datos relacional convencional, con un conjunto adicional de índices y formas de acceder a las tablas, en Big Data se pueden analizar datos de diferentes formatos, tanto estructurados como no estructurados, entendiendo estos últimos como aquellos que no se almacenan en una base de datos convencional.

Actualmente se analizan más datos estructurados que no estructurados, si bien la tendencia es la de un crecimiento superior de los no estructurados, lo cual conlleva nuevos retos para analizar determinados volúmenes de datos no estructurados.