Guía para diseñar sistemas de aprendizaje automático
Tabla de contenidos
- Introducción
- Entendiendo el problema
- Identificación de métricas
- Conocer la escala y latencia del sistema
- Sesión de lluvia de ideas
- Preparación de datos y generación de datos de entrenamiento
- Selección de características
- Iteraciones de ML
- Empaquetado y entrega del sistema
- Conclusiones
Diseñando sistemas de ML: Una guía paso a paso 🤖
¡Hola a todos y bienvenidos de nuevo a nuestro nuevo video! En este video, discutiremos cómo diseñar sistemas de aprendizaje automático y presentaremos un plan detallado para resolver cualquier problema, desde su concepción hasta su implementación. Analizaremos todos los aspectos de manera metódica y los hilaremos en un flujo de pensamiento coherente. Sin embargo, siéntanse libres de agregar o eliminar cualquier elemento según sus prácticas o las de su organización. ¡Comencemos!
Introducción 👋
Al abordar cualquier proyecto de diseño de sistemas de aprendizaje automático, es fundamental comprender completamente el problema que estamos tratando de resolver. Antes de sumergirnos en el desarrollo de modelos y la preparación de datos, debemos responder a algunas preguntas clave:
- ¿Qué problema estamos tratando de resolver?
- ¿Para quién estamos resolviendo este problema?
- ¿Cómo van a utilizarlo las personas? ¿Qué experiencia tendrán?
- ¿Cuándo esperamos tener esto terminado? ¿Hay plazos estrictos o lineamientos que debemos cumplir?
Responder a estas preguntas sentará las bases para todas las decisiones que tomemos a lo largo de este proceso.
Entendiendo el problema 🤔
El siguiente paso es identificar las métricas adecuadas para evaluar el rendimiento de nuestro sistema. Como dice el dicho, "si no puedes medir Algo, no puedes mejorarlo". Antes de empezar a desarrollar modelos y preparar datos, debemos tener claridad sobre cómo vamos a medir el éxito o el rendimiento del sistema. Esto implica tener en cuenta las siguientes consideraciones:
- ¿Tenemos datos etiquetados para hacer una evaluación precisa o necesitaremos generarlos?
- Si no tenemos datos etiquetados, ¿cuál será nuestra estrategia para crearlos?
- Debemos tener en cuenta tanto la evaluación "offline" como la "online". La evaluación offline nos proporcionará información sobre el rendimiento del sistema en un entorno controlado, mientras que la evaluación online nos permitirá evaluar cómo se comporta el sistema en producción y si cumple con los objetivos establecidos.
Es importante tener en cuenta que, en algunos casos, puede ser necesario evaluar factores de escala y latencia del sistema. Esto nos ayudará a determinar si necesitamos implementar soluciones complejas basadas en deep learning o si podemos optar por otras alternativas más simples. Con esta información, estaremos en una posición sólida para planificar nuestros próximos pasos.
Continúa leyendo...
¡Descubre cómo realizar una sesión de lluvia de ideas efectiva y crea una prueba de concepto exitosa!