Noticias y Blog

Algoritmos de aprendizaje automático: aprendizaje supervisado

03 - giribona
Noticias

Algoritmos de aprendizaje automático: aprendizaje supervisado

Editado por Pier Giuseppe Giribone

El artículo anterior de esta columna proporcionó una definición de aprendizaje automático y destacó las principales diferencias de funcionamiento entre un algoritmo tradicional y uno diseñado de acuerdo con los paradigmas modernos del aprendizaje automático.

Este artículo y los siguientes se centrarán en los criterios de clasificación más comunes para los algoritmos de aprendizaje automático. Comenzaremos analizando cómo se pueden dividir según el tipo de aprendizaje que se esté diseñando.

Los sistemas de aprendizaje automático se pueden clasificar según la cantidad y el tipo de supervisión a la que están sometidos durante el entrenamiento (la formación).

La literatura suele reconocer cuatro categorías principales: aprendizaje supervisado (aprendizaje supervisado), aprendizaje no supervisado (aprendizaje sin supervisión), aprendizaje semisupervisado (aprendizaje semisupervisado) y aprendizaje por refuerzo (aprendizaje por refuerzo)Comencemos por comprender las características fundamentales que distinguen al primer tipo, que es también el más extendido y utilizado.

En el aprendizaje supervisado, el conjunto de entrenamiento utilizado para entrenar el algoritmo incluye las soluciones deseadas, llamadas EtiquetaEste método de aprendizaje es muy similar al proceso mediante el cual los humanos aprenden del conocimiento empírico. La metáfora más apropiada es que los humanos adquieren conocimiento resolviendo problemas.

Consideremos el proceso de resolución de problemas descrito por el siguiente flujo lógico:

  • Selecciona un ejercicio que proponga resolver un problema. Aplica tus conocimientos para encontrar la solución. La respuesta obtenida se compara con la correcta.
  • Si la respuesta es incorrecta, el conocimiento actual se modifica.
  • Repita los pasos 2) y 3) para todos los ejercicios que presenten algún problema.

Si aplicáramos una analogía entre este ejemplo que ilustra el proceso de aprendizaje humano y el proceso de entrenamiento de un método de aprendizaje automático, podríamos considerar que los ejercicios que proponen problemas y sus soluciones corresponden a los datos de entrenamiento y al conocimiento que está desarrollando el modelo. El aspecto clave para un método de aprendizaje supervisado es que estén disponibles las soluciones a los problemas propuestos. Dado que las soluciones a los problemas en los que se basará el conocimiento deben ser correctas, es esencial que haya un supervisor que proporcione un conjunto de datos de entrenamiento correcto y sin sesgos (imparcial).

Una tarea típica para el aprendizaje supervisado es: clasificaciónEl filtro de spam es un buen ejemplo: está entrenado con ejemplos de correos electrónicos regulares y no regulares (clases) y deben aprender de estos para clasificar los nuevos.

Otra tarea típica para un algoritmo supervisado es predecir un valor numérico objetivo, como el precio de un automóvil, dado un conjunto de Imagen a Diseño (por ejemplo: kilometraje, marca, desgaste…) dijo vaticinadorEsta tarea se llama regresiónPara entrenar el sistema, necesitamos un amplio conocimiento previo, que incluya tanto las variables predictoras como sus etiquetas (es decir, sus precios).

En el contexto crediticio, un ejemplo de clasificación dicotómica lo proporciona un algoritmo de aprendizaje automático que, tras ser entrenado con un conjunto de datos de ratios de capital significativos (características) asociados a la información de interés, como si las empresas estaban en quiebra o no (etiquetas), ofrece indicadores útiles del posible impago de los nuevos solicitantes. El algoritmo debe estimar la clase a la que pertenece la empresa (impago sí/no), consultándola en función de los ratios de capital de la nueva empresa.

El concepto anterior puede extenderse a un contexto de clasificación multiclase. En este caso, el algoritmo de aprendizaje automático no proporcionará una simple indicación binaria de "sí/no por defecto", sino que generará un nivel de pertenencia basado en una escala ordenada de valores. Esta metodología de clasificación es similar al procedimiento utilizado por las agencias de calificación, que asignan un nivel de solvencia a la empresa en cuestión.

El propósito de una regresión estadística es estimar una relación funcional potencialmente existente entre la variable dependiente (Etiqueta) y las variables independientes (Imagen a Diseño).

Por lo tanto, existen numerosos ejemplos de posibles aplicaciones en el sector bancario: el análisis de las estructuras temporales de los tipos de interés en la ciencia actuarial, el análisis de series históricas de rentabilidad de activos en econometría, el estudio de la posible tendencia futura de un precio en función de la publicación de nuevos datos macroeconómicos en las operaciones bursátiles, la reconstrucción y regularización de superficies de volatilidad para una estimación más fiable del valor de una opción en finanzas cuantitativas, etc.

Si consideramos los ejemplos anteriores, en el aprendizaje supervisado, cada conjunto de datos de entrenamiento consta de pares de entradas y salidas correctas, es decir, lo que se espera como lógica de salida del modelo si se le dan las entradas correspondientes.

{entrada, salida correcta}

El aprendizaje supervisado consiste en una serie de revisiones que se realizan sobre un modelo con el fin de reducir la diferencia entre la salida correcta y la salida proporcionada por el modelo con los mismos datos de entrada.

Si el modelo se entrena a la perfección, producirá un resultado lo más cercano posible a la salida correcta para un conjunto de entradas dado. Tanto la clasificación como la regresión son tipos de problemas que se abordan mediante este tipo de aprendizaje.

La clasificación determina a qué grupo pertenecen los datos de entrada, por lo que el "resultado correcto" se implementa como una categoría. En cambio, la regresión predice valores, y el "resultado correcto" es un valor numérico.

Antes de concluir, es importante aclarar la diferencia entre un atributo y una característica.

Como regla general, en el aprendizaje automático un atributo es un tipo de dato (por ejemplo, kilometraje), mientras que un Imagen a Diseño Puede tener distintos significados según el contexto, pero generalmente se refiere a un atributo acompañado de su valor (por ejemplo, kilometraje = 12.000). Sin embargo, es común usar estas dos palabras indistintamente.

El siguiente artículo se centrará en analizar las características fundamentales que distinguen a los algoritmos de aprendizaje automático cuyo aprendizaje es no supervisado.

Seleccione los campos que se mostrarán. Otros estarán ocultos. Arrastre y suelte para reorganizar el orden.
  • Imagen
  • (SKU)
  • Valoración
  • Precio
  • Stock
  • Disponibilidad
  • Añadir al carrito
  • Descripción
  • Contenido
  • Peso
  • Dimensiones
  • Información Adicional
Haga clic fuera para ocultar la barra de comparación
Compara