Gracias a SAP Analytics Cloud, no necesitas ser un científico de datos para aprovechar el poder del Machine Learning

En estos días, el "machine learning" es una palabra comúnmente utilizada en una amplia gama de industrias. La necesidad de administrar, analizar e informar sobre conjuntos de datos a gran escala ya no se limita a las empresas tecnológicas: los sectores desde el comercio minorista hasta la manufactura y la atención médica dependen de los científicos de datos para dar sentido a los enormes volúmenes de datos recopilados en la ejecución de sus negocios e intentar usarlo para planificar el futuro, optimizar procesos y predecir riesgos y oportunidades.

Ahora, sin embargo, la misma tecnología inteligente que permite a los especialistas manipular estos conjuntos de datos ha evolucionado para simplificar el proceso de interacción con esas mismas herramientas. Esto ha reducido la barrera de entrada en términos de procesamiento y análisis de datos, permitiendo a los que no son especialistas implementar el aprendizaje automático para hacer predicciones e identificar patrones en sus datos.

Un excelente ejemplo de tal implementación es Smart Predict, parte de SAP Analytics Cloud, que combina una interfaz fácil de usar con algoritmos preescritos para permitir que cualquiera asuma el papel de científico de datos dentro de sus organizaciones.

Veamos más detalladamente cómo funciona Smart Predict:

Crear un modelo predictivo en SAP Analytics Cloud

Dentro de SAP Analytics Cloud hay tres tipos distintos de "Escenarios predictivos". Cada uno es adecuado para una tarea ligeramente diferente y requiere entradas diferentes:

A. Clasificación: se utiliza para predecir el valor de un objetivo. SAP Analytics Cloud devuelve el porcentaje de probabilidad de que ocurra cada uno de los dos resultados.

1 .png

B. Regresión: se usa para predecir el valor numérico de un objetivo en función de una selección de variables que lo describen. SAP Analytics Cloud devuelve un valor numérico.

2 .png

C. Series temporales: se utiliza para pronosticar valores numéricos durante un período de tiempo específico, en función de los datos existentes. SAP Analytics Cloud devuelve una serie de valores que se pueden mostrar en una gráfica.

3 .png

Entrenando el modelo predictivo

Para crear un escenario predictivo, necesitamos entrenar el modelo utilizando un conjunto de datos existente, ya sea un conjunto de datos de capacitación o de aplicación. El resultado de esto creará un tercer conjunto de datos.

  1. Conjunto de datos de capacitació: conjunto de datos de entrada que usamos para generar nuestro modelo predictivo, que contiene datos históricos sobre el valor que queremos predecir. La variable objetivo es la columna relacionada con nuestra pregunta comercial.

  2. Conjunto de datos de la aplicación: se utiliza para crear predicciones con datos actuales o nuevos. Los valores para la variable objetivo son desconocidos.

  3. Conjunto de datos de salida: contiene nuestras predicciones y cualquier columna agregada que hayamos solicitado.

Cuando entrenamos el modelo, la herramienta divide nuestro conjunto de datos en dos subconjuntos. Genera modelos predictivos utilizando el primero, y aplica cada versión del modelo predictivo para probar la precisión y robustez frente al segundo. La versión con mejor rendimiento es el modelo predictivo seleccionado.

Después de esto viene una etapa de informe donde se evalúa el modelo predictivo seleccionado para decidir si el modelo está listo para usarse o no. En este punto, tenemos la opción de aplicar el modelo, mejorarlo o crear uno nuevo desde cero.

Variables

Para poder crear un escenario predictivo, necesitamos varios parámetros o variables. Las variables son los valores de las columnas en nuestro conjunto de datos y, según el escenario predictivo, intervendrán diferentes tipos de variables, por ejemplo:

  1. Variable objetivo: la respuesta a nuestra pregunta (la variable que estamos tratando de generar). Se utiliza en todos los escenarios predictivos, pero en las series temporales se denomina variable de señal.

  2. Variable de fecha: dimensión de tiempo. Obligatorio para el escenario predictivo de series temporales.

  3. Variable segmentada: para dividir nuestros datos y la predicción en subsecciones, por ejemplo, por categoría de producto. Esta variable solo se usa en escenarios predictivos de series temporales y es opcional.

  4. Variable excluida: datos a ignorar en el modelo predictivo. Es una variable opcional y se puede utilizar en todos los escenarios predictivos.

  5. Variable de influencia: otros datos que se utilizarán para explicar la variable objetivo. Es una variable opcional y se puede utilizar en todos los escenarios predictivos.

Es importante no confundir variables y roles. La diferencia es que las variables son los valores de columna de nuestro conjunto de datos, y los roles son variables asignadas que se utilizan para crear un modelo predictivo.

Evaluando la precisión de nuestro modelo

Una vez que se ha creado el modelo, podemos ver un conjunto de parámetros que nos ayudan a evaluar la precisión del modelo predictivo. Veamos algunos ejemplos y cómo podemos analizarlos para determinar el éxito de nuestro modelo.

Escenario de series de tiempo

En este ejemplo, intentamos pronosticar las ventas de una variedad de productos y segmentaremos el pronóstico por categorías de productos. La medida más importante que debemos considerar es el MAPE (Error porcentual absoluto medio). Esta es la probabilidad de error de las ventas futuras predichas por ese modelo.

En la captura de pantalla que se muestra a continuación podemos ver el MAPE de cada categoría de producto, en el lado izquierdo los valores más bajos y en el lado derecho los más altos. Finalmente, en la parte inferior, podemos ver el MAPE medio del modelo.

4 .png

También podemos ver los factores que el modelo predictivo ha considerado. En el siguiente ejemplo, podemos ver nuestros valores de pronóstico reales, "valores atípicos" que son puntos muy distintos de la desviación estándar y, finalmente, la línea discontinua, que representa la zona de error del valor predicho con valores máximos y mínimos.

5 .png
6 .png

En realidad, el modelo predictivo nos daría muchos más gráficos para analizar, pero con estos conceptos básicos podemos ver cómo se puede medir la precisión de nuestra predicción usando el algoritmo de series temporales.

Escenario de clasificación

En este ejemplo, clasificaremos a los clientes que el negocio puede perder. Hay dos valores importantes a tener en cuenta. El primero es el poder predictivo (KI), que es la proporción de información que nuestro modelo puede explicar, y proporciona el porcentaje de cuán cerca está nuestro modelo de la perfección. El segundo es la confianza de predicción (KR), muestra la robustez, que es la tasa de éxito de nuestro modelo en la identificación de futuras pérdidas de clientes.

En la siguiente imagen podemos ver el KI y KR de nuestro modelo, podemos ver que ambos son relativamente altos, lo cual es una buena noticia!

7 .png

Otra vista interesante de la precisión de nuestro modelo se puede ver en el cuadro a continuación, donde comparamos el rendimiento del modelo (línea azul) con la posibilidad aleatoria (rojo) y un modelo perfecto donde se detectan todas las pérdidas (verde). Como podemos ver, en este caso, nuestro modelo rastrea el modelo perfecto de manera extremadamente estrecha, lo que indica un alto grado de precisión.

8 .png

También podemos ver, por ejemplo, un gráfico de todas las variables que el proceso de generación del modelo encontró relevantes y clasificarlas por la fuerza de su efecto sobre las pérdidas de clientes.

9 .png

Como en el ejemplo anterior, el modelo predictivo nos daría muchos más gráficos, pero aquí hemos resumido la ilustración más básica del modelo.

Analizando y reportando los resultados

El último paso en el proceso es analizar los resultados finales de la predicción. SAP Analytics Cloud facilita esto a través de una opción llamada "Smart Discovery" con la que podemos explorar nuestros datos utilizando algoritmos de Aprendizaje Automático para descubrir elementos influyentes clave, valores inesperados y más.

Cuando creamos la historia con Smart Discovery y el modelo de Clasificación explicado anteriormente, la herramienta genera automáticamente dos páginas de información: una que brinda una visión general y otra que muestra los elementos influyentes clave del modelo.

Simplemente presionando un botón tenemos un tablero de instrumentos, este es un buen punto de partida. Además, el panel creado es interactivo, a la derecha podemos ver una selección de entrada, este selector tiene la función de cambiar la medida que se muestra en los gráficos, por lo que podemos ver diferentes indicadores en la misma vista: la influencia, la distribución, etc. para los batidores y clientes activos.

10 .png
11 .png

Como SAP Analytics Cloud es también una herramienta de autoservicio de BI (Business Intelligence), podemos ajustar el diseño del informe, agregando más visualización en las páginas existentes o en una nueva página. Por ejemplo, podemos agregar una nueva página con un gráfico de pronóstico de las ventas en nuestra tienda logradas a partir de nuestro modelo de Series de Tiempo explicado anteriormente.

12 .png

Como podemos ver en los ejemplos que exploramos en este artículo, la ventaja comercial clave de Smart Predict es que los usuarios de SAP Analytics Cloud pueden generar predicciones rápida y fácilmente, a través de una interfaz sencilla, así como comprender claramente la precisión de la salida, sin la necesidad de asignar la tarea a un especialista.

Los algoritmos preescritos en Smart Predict son útiles para cientos de posibles aplicaciones, lo que permite a los gerentes y ejecutivos analizar rápidamente conjuntos de datos para predecir el rendimiento futuro y ayudar a la toma de decisiones o pronósticos, con una sobrecarga administrativa muy reducida.

Si bien esta tecnología no reemplaza la experiencia de un científico de datos calificado en todos los escenarios, para los tipos comunes de pronóstico y modelado, representa un avance en la eliminación de la barrera de entrada para utilizar el aprendizaje automático.

Si deseas obtener más información sobre cómo Smart Predict podría revolucionar el acceso al aprendizaje automático y los modelos predictivos dentro de su organización, el equipo de Clariba estará encantado de demostrarlo.

EspañolEnglish