Desempacando el SAP Data Warehouse Cloud – Parte 4

En este artículo, lo guiaremos a través del proceso de creación de modelos de datos virtuales en SAP Data Warehouse Cloud para que sus datos estén fácilmente disponibles para los usuarios comerciales.

Hasta ahora, en la serie hemos cubierto varios temas, como la gestión del espacio, la configuración de sus conexiones, la creación de procesos de integración con Data Flows y la preparación de sus datos. En este artículo, explicaremos la base de los conceptos de modelado de datos y cómo se aplican estos principios en  SAP Data Warehouse Cloud.

¿Qué es el modelado de datos?

El modelado de datos es la clave para la forma en que obtenemos y almacenamos nuestros datos y brindamos información procesable a los usuarios comerciales en  SAP Data Warehouse Cloud. Dependiendo de las técnicas de modelado de datos que utilice, la adaptabilidad y el rendimiento pueden variar mucho.

La definición de un modelo de datos es la forma en que estructura todos sus datos especificando las diferentes relaciones entre todos los elementos. Esta estructura debe alinearse con las necesidades de su negocio en términos de rendimiento de consultas y la capacidad de crear análisis en la parte superior, además de hacerlo escalable y fácil de mantener.

Antes de comenzar con su modelo de datos, debe identificar cuáles son las preguntas comerciales que está tratando de responder y enumerar todos los elementos relacionados con ellas.

1. Hechos, medidas y dimensiones

Como se mencionó anteriormente, el modelo de datos contendrá hechos, medidas y dimensiones. Un hecho es la parte de sus datos que indica una ocurrencia o transacción específica, como la venta de un producto o la recepción de un envío de una cierta cantidad de artículos de un proveedor. Tenga en cuenta que un hecho se compone de varias medidas, que pueden ser cualitativas, como un SKU de producto, o cuantitativas, como el precio de un producto. Las medidas cualitativas pueden luego vincularse a características específicas de esa medida, que se denominan dimensiones.

Las dimensiones son piezas de datos que le permiten comprender e indexar medidas en sus modelos de datos. Las dimensiones son características de una medida o datos que ayudan a contextualizar el hecho.

La separación entre hechos y dimensiones tiene un impacto en sus modelos de datos y en cómo se ve su representación gráfica. Por ejemplo, un esquema de estrella simple de los Mejores Zapatos para Correr se vería así:

clariba_dwc_4_1.jpg

2. Tipos de Modelos

En SAP Data Warehouse Cloud, puede crear modelos de datos físicos y lógicos:

Los modelos de datos lógicos le permiten determinar y conectar atributos específicos de datos. Por ejemplo, aquí es donde debe asegurarse de que los datos sobre su cliente estén completos con el nombre completo, el nombre de la calle, la ciudad, el país y el código postal, entre otros puntos de datos sobre cada cliente.

Los modelos de datos físicos determinan cómo se almacenan físicamente los datos, por ejemplo, en qué unidad se almacenan.

Los modelos de datos pueden ser simples o complejos según las necesidades de su negocio.  SAP Data Warehouse Cloud le brinda la flexibilidad de elegir entre consultas SQL o vistas gráficas.

3. Diagrama entidad-relación

Este es el primer paso para iniciar el modelado de datos, aquí definirás todos los elementos y entidades y definirás la relación entre todos ellos. Esto es lo que llamamos un diagrama de relación entre entidades (ERD, por su sigla en inglés). Por ejemplo: Producto, Proveedor, Dirección, etc.

The basics elements in an ERD are entities, attributes, and relationshipsLos elementos básicos de un ERD son entidades, atributos y relaciones.  

4. Data Builder

En SAP Data Warehouse Cloud, comience con Data Builder y seleccione el espacio en el que desea modelar sus datos.

clariba_dwc_4_2.png

Luego, haga click en New Graphical View.

clariba_dwc_4_3.png

El siguiente paso es utilizar el panel lateral izquierdo para seleccionar sus fuentes de datos. Puede utilizar los datos que ya se encuentran en el Repositorio de este espacio o seleccionar entre las fuentes conectadas a este espacio.

clariba_dwc_4_4.png

4.1 Inicie el modelado

Para comenzar a modelar sus datos, seleccione una tabla o vista, haga clic en ella y arrástrela al lienzo en el medio de la pantalla. Una vez que lo suelte en el lienzo, se creará automáticamente un nodo Output y se vinculará a la tabla o vista que arrastró al lienzo.

clariba_dwc_4_5.png
clariba_dwc_4_6.png

You can now drag and drop other tables or views on top of the one already on the canvas. As you drag the first table or view, you will see a pop-up listing Union and Join.

Esta es su oportunidad de elegir hacer una unión de estas tablas, lo que significaría una salida con el contenido completo de ambas tablas o vistas. Si no elige específicamente una Union, todas las tablas y vistas se unirán de forma predeterminada. No es necesario que elija Join específicamente, simplemente suelte la mesa y automáticamente se unirá. Una vez que tenga su primera unión, notará que el lienzo se reorganiza para mostrar un nodo de Join y un nodo de Projection. Si hace clic en el nodo Join, puede ver que la barra lateral derecha muestra los detalles de esta unión, incluidas las columnas que se asignan juntas. Puede cambiar el tipo de combinación o cambiar las asignaciones entre las dos tablas.

clariba_dwc_4_7.png

Si desea eliminar un mapeo existente, simplemente haga clic en la línea entre las dos columnas y luego haga clic en el icono de la papelera en rojo.

Después de agregar todas sus fuentes de datos y determinar las formas en que estas tablas o vistas están conectadas (o unidas), es posible que observe algunas alertas amarillas en la parte superior de algunos de los nodos de  Projection.

clariba_dwc_4_9.png

Por lo general, esto significa que su combinación incluye algunas columnas que tienen exactamente el mismo nombre técnico. Puede hacer clic en uno de los nodos de Proyección con una alerta amarilla, luego hacer clic en el icono del escudo para ver cuál es el problema.

Para resolver este problema, puede cambiar el nombre u ocultar una columna duplicada. Si está seguro de que las columnas tienen exactamente la misma información, debe ocultarla. Para hacer eso, simplemente haga clic en el nombre de la columna, luego haga clic en Set Hidden. Sin embargo, si el contenido de la columna es similar, pero no exactamente el mismo, puede cambiar el nombre de la columna para asegurarse de que la información esté presente en su salida, pero no cree problemas con la duplicación.

Para cambiar el nombre de una columna, haga clic en el nodo Projection, luego haga clic en la columna a la que desea cambiarle el nombre. Esto resaltará de qué tabla o vista proviene esta tabla.

clariba_dwc_4_12.png

Una vez que esté seguro de que esta es la columna de la derecha de la tabla de la derecha, simplemente haga clic en el icono de tres puntos y haga clic en  Change Business Name.

4.2 Transformación de datos y vista previa

Si desea asegurarse de que su salida de datos incluya solo los datos correctos, puede profundizar en sus datos eligiendo agregar filtros a sus nodos de unión, proyección o salida. Simplemente haga clic en el nodo que desea filtrar, luego haga clic en el icono de Filter junto al nodo.

Ahora verá las Filter Properties en la barra lateral derecha. Puede filtrar en función de columnas o escribir sus expresiones según sea necesario. Todos sus cambios aquí se guardan automáticamente, así que cuando haya terminado, vaya al siguiente paso.

Otra transformación que puede hacer con SAP Data Warehouse Cloud es crear una nueva columna calculada y agregarla a su salida. Para comenzar, simplemente haga clic en el ícono fx al lado del nodo de salida, proyección o unión.

Luego, en la barra lateral derecha, puede seleccionar una columna existente para agregar un cálculo y hacer clic en el ícono de lápiz al lado de la columna. Alternativamente, puede hacer clic en el icono más para agregar una nueva columna calculada.

clariba_dwc_4_16.png

Nuevamente, puede usar las funciones, columnas y operadores en la barra lateral derecha para crear su cálculo.

clariba_dwc_4_17.png
clariba_dwc_4_18.png

Finalmente, puede ver una muestra de sus datos haciendo clic en el botón Preview Data. Este botón se puede encontrar en varios lugares. Por ejemplo, puede hacer clic en él junto a su nodo de salida. También puede hacer clic en él en el menú superior, junto a los iconos Save y Deploy

Alternativamente, puede optar por obtener una vista previa de solo una tabla o una combinación. Para hacer eso, simplemente haga clic en el ícono Preview Data junto a la tabla o nodo del que desea obtener una vista previa.

clariba_dwc_4_19.png

Verá la vista previa en el área central inferior de la pantalla. Tenga en cuenta que puede confirmar qué vista previa está viendo al verificar el título de la vista previa en Data Preview: Output.

clariba_dwc_4_20.png

4.3 Listo para implementar

Cuando haya terminado con su modelado y transformación de datos, aún debe asegurarse de guardar o guardar e implementar su modelo de datos. Debe elegir Save si aún no ha terminado con su modelado y aún hará cambios en él antes de usar el modelo de datos en una historia de datos.

Si ha terminado de modelar, puede hacer clic directamente en el icono Implementar para implementar su modelo de datos, que también lo guarda en el Repositorio de su espacio. Si aún no ha agregado un nombre comercial y técnico a este modelo de datos, se le pedirá que lo haga al hacer clic en los íconos Save o Deploy. Su modelo de datos estará disponible para su uso en Data Stories si determina que es un Fact (Hecho) y después de implementarlo correctamente.

5. Cómo crear un diagrama entidad-relación

Como se explicó en una sección anterior, los ERD son el primer paso para comenzar a modelar, ya que define todos sus elementos y relaciones entre todos los elementos antes de implementarlos técnicamente. Le ayudan a visualizar las relaciones entre sus tablas y vistas, así como las dependencias entre ellas.

Para crear estos diagramas en SAP Data Warehouse Cloud debe seguir estos pasos:

Vaya a Data Builder y seleccione su espacio.

En Data Builder, seleccione New Entity-Relationship Model.

clariba_dwc_4_23.png
clariba_dwc_4_24.png

Usando sus Sources, arrastre y suelte las diferentes tablas en el lienzo. Cuando arrastre cada tabla, se le pedirá que importe e implemente (Deploy) cada tabla en el lienzo. Asegúrese de hacer clic en YES para agregar la tabla al lienzo.

Al hacer clic y arrastrar el icono de flecha a la tabla asociada lógicamente, establece una relación entre esas dos tablas en una dirección específica. Por ejemplo, puede conectar la tabla Products a una lista adicional de Product Category, que agrega información relevante a la tabla Product.

clariba_dwc_4_25.png

Puede ver qué columnas están unidas revisando los resaltados amarillos que se muestran cuando hace clic en la flecha de unión entre dos tablas.

clariba_dwc_4_26.png

Ahora puede repetir este proceso para todas las tablas que desee incluir en su modelo ER. Cuando haya terminado, asigne un Business Name (nombre comercial) a su modelo ER y cambie los nombres técnicos de las tablas por nombres comerciales que puedan ser más claros. Luego haga clic en el ícono Save.

clariba_dwc_4_27.png

Luego podrá ver el modelo ER recién creado en la lista de tablas y vistas disponibles en su Generador de datos. Hay muchas aplicaciones para un modelo ER, pero una que es específica de SAP Data Warehouse Cloud es habilitar la función de Join Recommendation (recomendación de unión) dentro del Data Builder. Una vez que tenga su modelo ER disponible dentro de su Espacio, siempre que desee crear una Vista Gráfica, puede aprovechar las recomendaciones de qué tablas deben unirse a la tabla que arrastró al lienzo.

Resumen

Después de leer esta publicación de blog y seguir los ejemplos dados anteriormente, debería estar listo para comenzar a modelar directamente en SAP Data Warehouse Cloud y aplicar los conceptos básicos que se explican aquí.

Para obtener información más detallada sobre elementos como las jerarquías y los editores de SQL, le recomendamos que profundice en los manuales del producto o en los viajes de aprendizaje disponibles en línea. Si tiene consultas específicas sobre la implementación de SAP Data Warehouse Cloud como su almacén de datos empresarial, póngase en contacto con nosotros directamente.

Nuestro próximo artículo se centrará en la creación de historias analíticas en SAP Data Warehouse Cloud, ¡así que recuerde estar atento a nuestro blog!


EspañolEnglish