¿Qué es el aprendizaje automático?

Una forma útil de introducir la metodología de aprendizaje automático es mediante una comparación con el flujo de diseño de ingeniería convencional.

Esto comienza con un análisis en profundidad del dominio del problema, que culmina con la definición de un modelo matemático. El modelo matemático está destinado a capturar las características clave del problema en estudio y generalmente es el resultado del trabajo de varios expertos. El modelo matemático finalmente se aprovecha para derivar soluciones hechas a mano al problema.

Por ejemplo, considere el problema de definir un proceso químico para producir una molécula determinada. El flujo convencional requiere que los químicos aprovechen su conocimiento de modelos que predicen el resultado de reacciones químicas individuales, con el fin de elaborar una secuencia de pasos adecuados que sinteticen la molécula deseada. Otro ejemplo es el diseño de algoritmos de traducción de voz o compresión de imagen / video. Ambas tareas implican la definición de modelos y algoritmos por equipos de expertos, como lingüistas, psicólogos y profesionales del procesamiento de señales, con frecuencia durante el transcurso de largas reuniones de estandarización.

El flujo de diseño de ingeniería descrito anteriormente puede ser demasiado costoso e ineficaz para problemas en los que se desean soluciones más rápidas o menos costosas. La alternativa de aprendizaje automático es recopilar grandes conjuntos de datos, por ejemplo, de voz, imágenes o videos etiquetados, y usar esta información para entrenar máquinas de aprendizaje de propósito general para que lleven a cabo la tarea deseada. Si bien el flujo de ingeniería estándar se basa en el conocimiento del dominio y en el diseño optimizado para el problema en cuestión, el aprendizaje automático permite que grandes cantidades de datos dicten algoritmos y soluciones. Con este fin, en lugar de requerir un modelo preciso del suplente de configuración, el aprendizaje automático requiere la especificación de un objetivo, de un modelo a entrenar y de una técnica de optimización.

Volviendo al primer ejemplo anterior, un enfoque de aprendizaje automático procedería entrenando una máquina de propósito general para predecir el resultado de reacciones químicas conocidas basadas en un gran conjunto de datos, y luego usando el algoritmo entrenado para explorar formas de producir moléculas más complejas. . De manera similar, se utilizarían grandes conjuntos de datos de imágenes o videos para entrenar un algoritmo de propósito general con el objetivo de obtener representaciones comprimidas de las cuales la entrada original se puede recuperar con cierta distorsión.

¿Cuándo utilizar el aprendizaje automático?

Basado en la discusión anterior, el aprendizaje automático puede ofrecer una alternativa eficiente al flujo de ingeniería convencional cuando el costo y el tiempo de desarrollo son las principales preocupaciones, o cuando el problema parece ser demasiado complejo para ser estudiado en toda su generalidad. Por otro lado, el enfoque tiene las desventajas clave de proporcionar un rendimiento generalmente subóptimo u obstaculizar la interpretación de la solución, y se aplica solo a un conjunto limitado de problemas. Con el fin de identificar las tareas para las que los métodos de aprendizaje automático pueden ser útiles, sugiere los siguientes criterios:
1. la tarea involucra una función que mapea entradas bien definidas a salidas bien definidas;
2. existen grandes conjuntos de datos que contienen pares de entrada-salida o pueden crearse;
3. la tarea proporciona una retroalimentación clara con metas y métricas claramente definibles;
4. la tarea no implica largas cadenas de lógica o razonamiento que dependan de diversos conocimientos previos o del sentido común;
5. la tarea no requiere explicaciones detalladas sobre cómo se tomó la decisión;
6. la tarea tiene tolerancia al error y no necesita soluciones óptimas o correctas demostrables;
7. el fenómeno o la función que se está aprendiendo no debe cambiar rápidamente con el tiempo; y
8. no se requiere destreza especializada, habilidades físicas o movilidad.

Estos criterios son pautas útiles para decidir si los métodos de aprendizaje automático son adecuados para una tarea de interés determinada. También ofrecen una línea de demarcación conveniente entre el aprendizaje automático como se pretende hoy, con su enfoque en herramientas de estadísticas computacionales y de capacitación, y nociones más generales de Inteligencia Artificial (IA) basadas en el conocimiento y el sentido común.

En definitiva, el Machine Learning es muy útil y tan progresivo en el campo de la programación y temas relacionados con las computadoras.