Machine Learning has become a central topic of interest in the media, thanks to its recent successful applications in creating value in a variety of business scenarios. At Clariba, as experts in predictive analytics, we are active agents of its adoption and democratization, since we have been applying ML in our predictive solutions for a long time. When used wisely and with the proper methodology, Machine Learning techniques can offer an increase in performance to businesses and organizations of all types.
Con esta serie, intentamos presentar a los recién llegados los diferentes tipos de Aprendizaje Automático, sus técnicas y algoritmos principales y sus usos comerciales. También queremos ayudar a desmitificar el término y brindar a nuestros clientes y prospectos ideas sobre cómo integrar el LD en sus procesos operativos y de toma de decisiones diarios.
¿Qué es Machine Learning?
El nombre Machine Learning fue introducido por Arthur Samuel en 1959. Es un campo de la ciencia que explora el desarrollo de algoritmos que pueden aprender y hacer predicciones sobre los datos. La principal diferencia con otros algoritmos comunes es la pieza de "aprendizaje". Los algoritmos de Machine Learning no son series de procesos ejecutados en serie para producir un resultado predefinido. En su lugar, son una serie de procesos que buscan "aprender" patrones de eventos pasados y construir funciones que pueden producir buenas predicciones, con un grado de confianza.
Within the field of data analytics, Machine Learning is part of a piece known as predictive analytics.
TIPOS Y USO
As we just described, the learning piece is what best defines this kind of algorithms. Depending on the type of learning, they are commonly divided into supervised, unsupervised, semi-supervised and reinforcement learning algorithms.
Comenzaremos esta serie con un ejemplo de algoritmos de aprendizaje supervisado.
Supervised learning algorithms try to find relationships and dependencies between a target output we want to predict – ranging from churn to insurance fraud or potential success of a sales promotion on different individuals - and data we have from other individuals from the past, including demographic characteristics or previous behavioural data. We use this past data as input variables to predict the most probable output value for new data, based on those relationships learned from previous data sets.
Los métodos supervisados más típicos son:
Árboles de Decisión
Regresión Lineal
El Vecino mas Cercano
Ingenuo Bayes
Máquinas de vectores de soporte (MVS)
Redes Neuronales
Árboles de Decisión
Los árboles de clasificación y regresión se conocen comúnmente como CART. El término fue introducido por Leo Breiman para referirse a los algoritmos de Árbol de Decisión que se pueden usar para problemas de modelado predictivo de clasificación o regresión.
El algoritmo básico de CART es la base para algoritmos más avanzados como árboles de decisión empaquetados, Random forest y árboles de decisión potenciados.
Los árboles de decisión generalmente se usan para predecir la probabilidad de lograr un resultado para una nueva observación (individuo, cliente, ...) según sus atributos (edad, demografía, comportamiento de compra, ...), utilizando datos anteriores que tenemos de un número suficiente de Observaciones similares o individuos. El resultado para predecir es normalmente binario: sí / no (se agitará / no se agitará, se comprará / no se comprará, ...).
Se denominan árboles porque se pueden representar como un árbol binario donde cada nodo raíz representa una única variable de entrada (edad, ciudad, segmento ...) y un punto de división en esa variable (suponiendo que la variable es numérica). Los nodos de hoja del árbol contienen la variable de salida (comprará, batirá, ...) que queremos predecir.
Comencemos con un ejemplo simple, donde trataremos de predecir el género en función de la altura y el peso de las personas. A continuación se muestra un ejemplo muy simple de un árbol de decisión binario:
El árbol se puede representar tanto como un gráfico o como un conjunto de reglas. Por ejemplo, a continuación se muestra el árbol de decisiones anterior, que describe un conjunto de reglas:
Si Altura > 180 cm Entonces Hombres
Si Altura <= 180 cm y peso 80 kg Entonces Hombre
Si Altura <= 180 cm Y Peso <= 80 kg Entonces Mujer
Con la representación de árbol binario del modelo CART descrito anteriormente, hacer predicciones es relativamente sencillo. Cada vez que evaluamos a un nuevo individuo, podemos predecir su género según la altura y el peso, con un grado de confianza.
Veamos un árbol de decisiones en acción, para ayudar a una empresa de telecomunicaciones de EE. UU. A evitar el abandono.
EJEMPLO DE CASO DE NEGOCIO: PREVENCIÓN DE IGLESIA EN UN TELCO
Tenemos un conjunto de datos de muestra con los siguientes atributos de un número significativo de clientes:
State: 2 characters representing the State
Account length: age of the account in days
Area code: postal code
International plan: Boolean yes/no explaining if the client has an international plan contracted
Voice mail plan: Boolean yes/no showing if the customer has a voice mail activated
Number vmail messages: total number of voice email messages managed
Total day minutes: average minutes of voice calls during daytime, per month
Total day calls: average number of calls during daytime, per month
Total day charge: average spending on day calls, per month
Total eve minutes: average minutes of voice calls during evening, per month
Total eve calls: average number of voice calls during evening, per month
Total eve charge: average spending on voice calls during evening, per month
Total night minutes: average minutes of voice calls during the night, per month
Total night calls: average number of voice calls during the night, per month
Total night charge: average spending on voice calls during the night, per month
Total intl minutes: average minutes on international calls, per month
Total intl calls: average number of international calls, per month
Total intl charge: average spending on international calls, per month
Customer service calls: number of calls to customer service
Churned: Boolean true / false meaning they churned from the company or they didn’t. This will be our target variable to predict and prevent.
La imagen a continuación representa una pequeña muestra de nuestro conjunto de datos que estamos usando para nuestras predicciones.
We use SAP Predictive analytics to help us build our decision tree, to respond to the business question: how could we prevent churn from customers, based on our historical data?
Veamos el resultado:
El árbol comienza con el análisis de toda la población, que en nuestro caso son 3332 clientes. Lo primero que notamos es que más del 14% de estos clientes han batido. La primera variable que el algoritmo muestra como decisiva para predecir la rotación es "llamadas de servicio al cliente". Como podemos ver en el recuadro a la derecha en la Fig 1, alrededor del 52% de los clientes que han llamado al servicio al cliente más de 3 veces terminan batiéndose. La compañía debe actuar de manera proactiva, llamar a esos clientes e intentar escucharlos y resolver sus problemas justo después de la 3 rd llamada.
Primera acción de prevención: llame proactivamente a todos los clientes inmediatamente después de la 3 rd llamada recibida al servicio al cliente para tratar de resolver sus problemas.
Sigamos analizando el árbol:
El siguiente nivel nos dice que hay una gran correlación entre no tener un correo de voz activado y batir, especialmente entre los clientes con un gasto diario bajo. Podríamos asumir que esos usuarios no usan sus teléfonos para trabajar, por lo que reciben un mejor servicio cuando tienen un servicio de correo de voz activo durante el día, lo que les permite ponerse al día con las llamadas y mensajes que faltan al final del día.
Segunda acción de prevención: inicie una campaña que ofrece la activación gratuita del correo de voz e informe proactivamente al segmento de clientes más relevante (cargo diario entre 0 y 24.43 $, mensual)
Finalmente, analicemos el nivel inferior del árbol usando "Plan Internacional" como separador de rama:
Como podemos ver, la tasa de pérdida de personal es mayor entre los clientes que tienen un plan de llamadas internacionales, independientemente de la combinación de las variables anteriores. Claramente, todos los clientes que tienen un plan de llamadas internacionales están descontentos y tienden a agitar más.
Tercera acción de prevención: revisar los planes internacionales y su adecuación al uso y las necesidades de cada segmento de clientes.
Resumen
Los árboles de decisión son un método fácil de representar frecuencias de atributos que sospechamos que pueden proporcionar información, ayudando a predecir un resultado. Pueden ser muy útiles para analizar las causas probables de los buenos y malos resultados comerciales y ayudarnos a mejorar nuestros niveles de servicio, aumentar la retención de clientes o prevenir el fraude, entre muchas otras aplicaciones.
Lo más importante es que los árboles de decisión, como muchos otros algoritmos ML, ya están disponibles en muchas de las soluciones de SAP BI. Clariba puede ayudarlo a identificar los procesos de aprendizaje automático que pueden agregar valor a su negocio e integrarlos en su ecosistema de BI existente. Contáctanos y estaremos encantados de ayudarte en este viaje.
Referencias
https://machinelearningmastery.com/classification-and-regression-trees-for-machine-learning/
https://towardsdatascience.com/types-of-machine-learning-algorithms-you-should-know-953a08248861