El data warehouse o almacén de datos, como también se le conoce, es un sistema de gestión de datos diseñado para habilitar y soportar actividades empresariales. Su capacidad analítica permite a las organizaciones obtener valiosos datos de su negocio en tiempo real y mejorar la toma de decisiones.
Para construir un data warehouse exitoso se requiere seguir los siguientes pasos:
1. Comprender el problema
El equipo de desarrollo de data warehouse debe realizar un diagnóstico de la cantidad de datos que maneja la empresa y las transformaciones digitales que se deben implementar, en caso sea necesario, antes de crear un sistema de gestión de datos. Conociendo a profundidad estos dos puntos, el data warehouse será un aliado potente para los altos mandos.
2. Identificar la fuente de los datos
Un data warehouse extrae datos de diversas fuentes. El equipo de desarrollo debe identificar todos los data marts (versión especial del almacén de datos centrado en un tema o área específica de negocio) que se utilizarán para el procesamiento de datos. Las fuentes de datos pueden ser de cualquier tipo: otras bases de datos (SQL/NoSQL), aplicaciones, redes sociales, encuestas, archivos de Excel, etc.
3. Crear el modelo de data warehouse
Una vez establecidos los data marts y definidos los datos, se crea una base de datos central para todos los elementos que estarán incluidos en el data warehouse. Esta base de datos central debe ilustrar todos los objetos -y sus propiedades- que irán en el almacén de datos.
4. Seleccionar las herramientas ETL adecuadas
Las herramientas ETL (Extracción, Transformación y Carga) se encargan de extraer los datos de las fuentes, transformarlos y cargarlos al data warehouse. En otras palabras, son pequeños programas que permiten transformar distintos formatos de fuentes a una que pueda procesar la base de datos central. Es muy importante seleccionar una herramienta ETL que tenga un manejo sencillo y represente, de manera visual, todas las transformaciones. Entre las herramientas más conocidas podemos mencionar: Microsoft - SQL Server Integrated Services (SSIS), IBM InfoSphere Information Server, Amazon Redshift y Oracle GoldenGate.
5. Emplear analítica inteligente
En esta etapa, se necesitan crear gráficos, cuadrículas y/o tablas para visualizar los datos y tomar las mejores decisiones. En esta etapa existen programas que permitirán generar reportes como Oracle BI, Microsoft PowerBI, entre otros.
6. Documentar
Para que un data warehouse sea exitoso, necesita ser parte funcional de las operaciones de una empresa y evolucionar a medida que el negocio también crezca. Por lo tanto, una buena documentación de cómo se ha venido desarrollando el almacén de datos y los logros que se han alcanzado gracias a él garantizarán su continuidad.
La implementación de un data warehouse proporciona a las empresas una visión más clara y detallada del negocio, lo que permita a los altos mandos tomar las mejores decisiones en el menor tiempo posible.
Fuente:
Oracle: What Is a Data Warehouse
Medium: 6 Steps to creating your own data warehouse
Talend: What is a Data Warehouse and Why Does It Matter To Your Business?
Cloudmoyo: How to implement the ETL steps for your data warehouse?
Portal de negocios de ESAN Graduate School of Business. Desde el 2010 difunde contenido de libre acceso (artículos, infografías, podcast, videos y más) elaborado por los más destacados especialistas. Encuentra contenido en más de 15 áreas y sectores como Administración, B2B, Derecho Corporativo, Finanzas, Gestión de Proyectos, Gestión de Personas, Gestión Pública, Logística, Marketing, Minería, TI y más. ¡Conéctate con los expertos de ESAN y aumenta tu conocimiento en los negocios!
Luis Mendiola, profesor de los Programas del área de Finanzas de ESAN, analizó en Forbes los posibles escenarios políticos y económicos que podrían desarrollarse con Donald Trump como presidente de los Estados Unidos, incluyendo su influencia en el mercado del oro.
El Comercio destacó la Maestría en Tecnologías de la Información de ESAN como una opción clave en la formación en ciberseguridad, frente al déficit de millones de profesionales especializados en esta área.
Luis Mendiola, profesor de los Programas de Finanzas de ESAN, explicó en Gestión los términos "vesting" y "cliff", que se están volviendo cada vez más comunes en el financiamiento de startups. Además, detalló que su aplicación en Perú se encuentra en una fase incipiente.