Machine Learning e Inteligencia Artificial se usan a menudo como intercambiables (sinónimos), pero no lo son. Veamos primero cómo se relacionan entre sí.
¿Qué es la Inteligencia Artificial?
I.A. es la ciencia de entrenar a máquinas para realizar tareas humanas. I.A. sostiene el concepto de que una computadora puede actuar como un cerebro humano, calculando los pasos en el camino que nos rodea cada segundo de cada día. La Inteligencia Artificial incluye razonamiento, procesamiento cognitivo, reconocimiento del lenguaje natural, planificación y otros campos de investigación, además de Machine Learning
¿Qué es Machine Learning?
Machine Learning es un subconjunto específico de inteligencia artificial que entrena a las máquinas para aprender.
El nombre Machine Learning fue introducido por Arthur Samuel en 1959. Es un campo de la ciencia que explora el desarrollo de algoritmos que pueden aprender y hacer predicciones sobre los datos. La principal diferencia con otros algoritmos comunes es la pieza de "aprendizaje". Los algoritmos de Machine Learning no son series de procesos ejecutados en serie para producir un resultado predefinido. En su lugar, son una serie de procesos que buscan "aprender" patrones de eventos pasados y construir funciones que pueden producir buenas predicciones, con un grado de confianza.
Within the field of data analytics, Machine Learning is part of a piece known as predictive analytics.
Los modelos de Machine Learning buscan patrones en los datos para tratar de esbozar conclusiones como lo harían las personas. Cuando el algoritmo es lo suficientemente bueno como para esbozzar las conclusiones correctas, aplica este conocimiento a nuevos conjuntos de datos.
Ciclo de aplicación de Machine Learning:
¿Qué necesita para funcionar bien?
Datos granulares
Grandes volúmenes de datos
Datos extremadamente diversos
Los cuatro tipos de Machine Learning
MACHINE LEARNING SUPERVISADO
Está compuesto por algoritmos que intentan encontrar relaciones y dependencias entre un producto objetivo que queremos predecir, que va desde la rotación hasta el fraude de seguros o el éxito potencial de una promoción de ventas en diferentes individuos, y datos que tenemos de otros individuos del pasado, incluidas características demográficas o datos de comportamiento previos. Utilizamos estos datos pasados como variables de entrada para predecir el valor de salida más probable para los nuevos datos, en función de las relaciones aprendidas de los conjuntos de datos anteriores.
Árboles de Decisión
Los árboles de clasificación y regresión se conocen comúnmente como CART. El término fue introducido por Leo Breiman para referirse a los algoritmos de Árbol de Decisión que se pueden usar para problemas de modelado predictivo de clasificación o regresión.
El algoritmo básico de CART es la base para algoritmos más avanzados como árboles de decisión empaquetados, Random forest y árboles de decisión potenciados.
Los árboles de decisión generalmente se usan para predecir la probabilidad de lograr un resultado para una nueva observación (individuo, cliente, ...) según sus atributos (edad, demografía, comportamiento de compra, ...), utilizando datos anteriores que tenemos de un número suficiente de Observaciones similares o individuos. El resultado para predecir es normalmente binario: sí / no (se agitará / no se agitará, se comprará / no se comprará, ...).
Se denominan árboles porque se pueden representar como un árbol binario donde cada nodo raíz representa una única variable de entrada (edad, ciudad, segmento ...) y un punto de división en esa variable (suponiendo que la variable es numérica).
Los nodos de hoja del árbol contienen la variable de salida (comprará, batirá, ...) que queremos predecir. Comencemos con un ejemplo simple, donde trataremos de predecir el género en función de la altura y el peso de las personas. A continuación se muestra un ejemplo muy simple de un árbol de decisión binario:
El árbol se puede representar tanto como un gráfico o como un conjunto de reglas. Por ejemplo, a continuación se muestra el árbol de decisiones anterior, que describe un conjunto de reglas:
Si Altura > 180 cm Entonces Hombres
Si Altura <= 180 cm y peso 80 kg Entonces Hombre
Si Altura <= 180 cm Y Peso <= 80 kg Entonces Mujer
Con la representación de árbol binario del modelo CART descrito anteriormente, hacer predicciones es relativamente sencillo. Cada vez que evaluamos a un nuevo individuo, podemos predecir su género según la altura y el peso, con un grado de confianza.
Los árboles de decisión son un método fácil de representar frecuencias de atributos que sospechamos que pueden proporcionar información, ayudando a predecir un resultado. Pueden ser muy útiles para analizar las causas probables de los buenos y malos resultados comerciales y ayudarnos a mejorar nuestros niveles de servicio, aumentar la retención de clientes o prevenir el fraude, entre muchas otras aplicaciones.
Regresión
Use of labelled data to make predictions in a continuous form.
The output of the input is always ongoing, and the graph is linear.
La regresión es una forma de técnica de modelado predictivo que investiga la relación entre una variable dependiente [Outputs] y una variable independiente [Inputs].
Esta técnica utilizada para pronosticar el clima, el modelado de series de tiempo, la optimización de procesos.
Linear Regression – relationship between two variables by fitting a linear equation to the observed data.
Ex: Predicción del precio de la vivienda, donde el precio de la vivienda se predecirá a partir de las entradas, como el número de habitaciones, la localidad, la facilidad de transporte, la edad de la vivienda, el área de la vivienda.
Cómo un aumento en el impuesto (para el alcohol) tiene una influencia para una cantidad de cigarrillos empacados consumidos por día.
Cómo las horas de sueño afectan nuestras calificaciones en los cursos.
Ver correlación de experiencia por salarios.
La correlación entre el piso de la casa es versus el precio de la casa.
La segunda aplicación es pronosticar nuevas observaciones (valores no observados).
Clasificación
It is the type of Supervised Learning in which labelled data is used to make predictions in a non-continuous form.
The output of the information is not always continuous, and the graph is non-linear.
En la técnica de clasificación, el algoritmo aprende de la entrada de datos que se le da y luego utiliza este aprendizaje para clasificar observaciones nuevas.
Este conjunto de datos puede ser meramente bi-class, o también puede ser multi-class.
Ex: Uno de los ejemplos de problemas de clasificación es verificar si el correo electrónico es spam o no spam entrenando el algoritmo para diferentes palabras spam o correos electrónicos. (Vecinos más cercanos a K, SVM, Kernel, Naïve Bayes, Árbol de Decisiones, Bosque Aleatorio)
Classification trees are used to separate the dataset into classes belonging to the response variable. Usually the response variable has two classes: Yes or No (1 or 0).
Regression trees are needed when the response variable is numeric or continuous. For example, the predicted price of a consumer good. Thus regression trees are applicable for prediction type of problems as opposed to classification.
Ejemplos
Si desea predecir si una persona hará clic en un anuncio online
En comparación, el algoritmo de Random forest selecciona al azar observaciones y características para construir varios árboles de decisión y luego promedia los resultados.
En el dominio de la atención médica se utiliza para identificar la combinación correcta de componentes en la medicina y para analizar el historial médico de un paciente para identificar enfermedades. En el comercio electrónico, el bosque aleatorio se utiliza para determinar si a un cliente realmente le gustará el producto o no.
Entendiendo por qué los clientes se van
"Cuesta mucho menos mantener un cliente existente que ganar un nuevo cliente"
El proveedor de servicios móviles debe poder observar los patrones a partir de los datos y las anomalías. El proveedor de servicios móviles tiene la ventaja de tener acceso a grandes volúmenes de datos entre muchos clientes diferentes. Al utilizar el algoritmo correcto, el proveedor puede crear un modelo que mapee los tipos de ofertas y promociones que retendrán a los clientes y agregarán nuevos.
¿Cuánto costará retener y agregar nuevos clientes? ¿Los nuevos planes reducirán los ingresos significativamente? ¿El gasto justificará los esfuerzos? Estos son los tipos de predicciones que puede proporcionar una técnica de aprendizaje automático. ¿Cuál es la diferencia entre un enfoque de BI tradicional y un enfoque de aprendizaje automático para la rotación de clientes?
Evitar que ocurran accidentes
Industries such as manufacturing, oil and gas, and Utilities succeed or fail based on their ability to prevent accidents. While it is common to have a maintenance schedule, that is often not enough.
Por ejemplo, puede haber una falla en un sistema de calefacción o aire acondicionado. Podría haber un cambio dramático en las condiciones climáticas que podrían afectar la maquinaria.
Machine learning algorithms can be applied to preventive maintenance in a number of ways. For example, a regression algorithm can be used as the foundation for a model that can predict time to failure of a machine. Various classification algorithms can be used to model the patterns associated with machine failures. Data generated by sensors provides a huge volume of semi-structured data that can model and compare patterns of performance so that an anomaly from normal performance can be detected.
MACHINE LEARNING NO SUPERVISADO
Los datos sin etiquetar se utilizan para entrenar el algoritmo, lo que significa que se usó contra los datos que no tienen etiquetas históricas.
El propósito es explorar los datos y encontrar alguna estructura dentro.
Ex: puede identificar segmentos de clientes con atributos similares que luego pueden ser tratados de manera similar en campañas de marketing.
O puede encontrar los atributos principales que separan los segmentos de clientes entre sí.
Popular techniques include self-organizing maps, nearest-neighbormapping, k-means clustering and singular value decomposition. These algorithms are also used to segment text topics, recommend items and identify data outliers.
Agrupación
Cluster analysis or Agrupación is the task of grouping a set of objects in such a way that objects in the same group (called a cluster) are more similar (in some sense) to each other than to those in other groups (clusters).
La agrupación de clientes utiliza datos de transacciones de compra para rastrear el comportamiento de compra y luego crear nuevas iniciativas comerciales basadas en los hallazgos.
The typical marketing goal is to emphasize and retain low-risk, high-value and high-profit customers – this “premium” cluster representing 10-20 percent of total buyers often produces 50-80 percent of a company’s profit.
Una vez que se identifica este grupo, debe considerar las técnicas de venta cruzada y venta cruzada que contribuirán aún más al potencial de rentabilidad de este grupo de datos atractivo.
Decision trees are sometimes used for marketing campaigns.
Es posible que desee predecir el resultado de enviar a los clientes y prospectos un cupón de 20 por ciento.
Puede dividir a los clientes en cuatro segmentos:
! Targeting the persuadables will give you the best return on investment (ROI). A decision tree will help you map out these four customer groups and organize prospects and customers based on who will react best to the marketing campaign.
Reducción de dimensionalidad
La reducción de la dimensión ayuda a los sistemas a eliminar datos que no son útiles para el análisis.
Este grupo de algoritmos se utiliza para eliminar datos redundantes, valores atípicos y otros datos no útiles.
Dimensionality reduction can be helpful when analyzing data from sensors and other Internet of Things (IoT) use cases. In IoT systems, there might be thousands of data points simply telling you that a sensor is turned on. Storing and analyzing that “on” data is not helpful and will occupy important storage space. In addition, by removing this redundant data, the performance of a machine learning system will improve.
Finally, dimensionality reduction will also help analysts visualize the data.
MACHINE LEARNING POR REFUERZO
Reinforcement learning is often used for robotics, gaming and navigation.
Con el aprendizaje por refuerzo, el algoritmo descubre mediante prueba y error qué acciones producen las mayores recompensas.
Este tipo de aprendizaje tiene tres componentes principales: el agente (el aprendiz o el que toma las decisiones), el entorno (todo con lo que el agente interactúa) y las acciones (lo que el agente puede hacer).
Aprendizaje profundo | Redes Neuronales
El aprendizaje profundo - redes neuronales complejas - está diseñado para emular el funcionamiento del cerebro humano, de modo que las computadoras puedan recibir capacitación para lidiar con las abstracciones y los problemas que están mal definidos.
Las redes neuronales y el aprendizaje profundo a menudo se usan en aplicaciones de reconocimiento de imagen, voz y visión de computadora.
Detección de Rostro
Reconocimiento de Voz
Resumen
Casos de ejemplo de uso de Machine Learning
Industria manufacturera
Detección de anomalías en plantas de fabricación de acero: supervisar el proceso de producción
Chequeo de calidad en la industria del automóvil: monitorear el proceso de montaje
Gestión de inventario: estimar la condición del inventario.
retail
Recomprometer a los clientes rezagados: predice qué cliente es poco probable que regrese
Aumenta el tamaño promedio de los pedidos: haz recomendaciones más inteligentes
Reduzca el desperdicio de marketing: para conocer qué productos reciben la mejor respuesta del consumidor y adaptar las tácticas de mercadeo.
Marketing y Ventas
Lifetime Value: predictions about most budding customers early and target sales effort toward them
Churn: predicciones de quién se está yendo, reenfocando y personalizando el trato
Análisis de opiniones: análisis de NLP en los comentarios de los clientes
Seguridad
Filtrado de Spam
Detección de Fraude: bloqueo de clientes / transacciones de dinero potencialmente fraudulentas