freeCodeCamp: Construyendo Cargas de Trabajo de IA Agentic - El Curso Intensivo Completo de 2 Horas
Un tutorial completo sobre cómo construir agentes de IA desde cero: llamadas a LLM, memoria, herramientas, patrones arquitectónicos, y por qué el elemento humano sigue siendo importante en un mundo de IA.
Por Qué los Agentes Son Diferentes de Todo lo Anterior en IA
Rola, una Arquitecta de Machine Learning en Tech42 (y ex doctorada en neurociencia), imparte una clase magistral sobre IA agentic que atraviesa el ruido mediático. Esto no es una visión conceptual - es un tutorial práctico con código Python funcional que muestra exactamente cómo los agentes difieren de los chatbots, los workflows y el ML tradicional.
La perspectiva clave: "An agent has dynamic control flow devised by the LLM at runtime, whereas a workflow is predefined coded graphs." (Un agente tiene flujo de control dinámico diseñado por el LLM en tiempo de ejecución, mientras que un workflow son grafos codificados predefinidos). Esta única distinción explica todo sobre cuándo usar agentes (y cuándo no).
Sobre la singularidad del boom de la IA generativa: A diferencia de olas anteriores de ML que requerían habilidades técnicas, "even my mother who has never touched a computer knows what ChatGPT is and uses it on her phone." (incluso mi madre, que nunca ha tocado una computadora, sabe qué es ChatGPT y lo usa en su teléfono). La democratización ocurrió porque estos modelos usan el lenguaje humano como interfaz.
Sobre qué cambió para hacer esto posible: Tres pilares tuvieron que avanzar simultáneamente - datos (megabytes a petabytes), tamaño del modelo (millones a billones de parámetros), y cómputo (entrenamiento serial a paralelo vía transformers). Los 1.8 billones de parámetros de GPT-4 se entrenaron durante 3 meses. Sin la paralelización del paper de transformers, todavía estaríamos esperando.
Sobre el bucle del agente: El núcleo es simple - planificar, actuar, observar, repetir. "You give it a task, it uses the LLM to plan and decompose that task, it acts with tools, observes the output, and loops until the solution is achieved." (Le das una tarea, usa el LLM para planificar y descomponer esa tarea, actúa con herramientas, observa el resultado, y repite hasta lograr la solución).
Los Cuatro Componentes que Todo Agente Necesita
El tutorial identifica lo que aparece consistentemente en todas las implementaciones de agentes:
- Propósito/Objetivo - La tarea que resuelve (system prompt)
- Razonamiento/Planificación - El LLM como el "cerebro"
- Memoria - Corto plazo (ventana de contexto) y largo plazo (almacenamiento externo)
- Herramientas/Acciones - Funciones, APIs, recuperación de datos que extienden las capacidades del LLM
Sobre la ausencia de estado del LLM: La demostración en vivo lo prueba - pregúntale a un LLM tu nombre, luego pregunta de nuevo más tarde en la conversación. Sin gestión de memoria, lo olvida. Por eso el código añade cada turno de conversación a la ventana de contexto.
Sobre las herramientas que extienden capacidades: Los LLMs tienen una fecha de corte de entrenamiento. No pueden decirte el clima, la fecha actual o la hora. Las herramientas resuelven esto dando al agente acceso a APIs externas. La demo lo muestra funcionando: "¿Qué hora es?" → llamada de herramienta → "1:43."
Cuándo Funcionan los Agentes (Y Cuándo No)
Esta es la sección más práctica - un marco de decisión para cuándo usar agentes vs. workflows:
Usa workflows cuando:
- Aplicaciones críticas para la misión o sensibles a errores
- Industrias reguladas que requieren resultados determinísticos
- Sistemas sensibles a la latencia
- Proyectos sensibles al costo (más fácil de estimar)
- Sabes exactamente cómo resolver el problema
Usa agentes cuando:
- El error es tolerable
- El camino de ejecución es difícil de codificar
- Necesitas mejor rendimiento (los agentes iteran = mejores resultados promedio)
- El costo no es la restricción principal
- La toma de decisiones dirigida por el modelo es aceptable
Las preguntas clave a hacer:
- ¿Es predecible el camino de la tarea?
- ¿Vale la pena el costo por el valor?
- ¿Es crítica la latencia?
- ¿Es aceptable la tolerancia a errores?
Arquitecturas Multi-Agente: Supervisor vs. Swarm
El tutorial incluye una comparación de costos en vivo entre dos patrones arquitectónicos:
Arquitectura supervisor: Un agente supervisor delega a agentes especializados (sumar, multiplicar, dividir). Los agentes no pueden hablar entre sí - todo se enruta a través del supervisor. Resultado: 16 saltos, 10 acciones de agente, 6 transferencias, ~8,000 tokens de entrada.
Arquitectura swarm: Todos los agentes pueden comunicarse directamente entre sí. Resultado: 8 interacciones, 2 transferencias, ~5,000 tokens de entrada.
La guía: Swarm es más barato para tareas simples. Pero a medida que crece la complejidad, las arquitecturas supervisor se vuelven más fáciles de depurar porque el espacio de soluciones está más restringido. "If you can get away with a single agent, you should try to get away with a single agent just because of the overhead." (Si puedes arreglártelas con un solo agente, deberías intentar arreglártelas con un solo agente solo por el overhead).
El Impulso de Estandarización: MCP, A2A, AGUI
Las interfaces de agentes se están estandarizando:
- MCP (Model Context Protocol) - El protocolo de Anthropic para herramientas y datos, ahora donado a Linux Foundation junto con OpenAI
- A2A (Agent2Agent) - El protocolo de comunicación agente a agente de Google
- AGUI - Estándar de interacción humano-agente de Copilot, Crew AI, y LangChain
"Think of it as a USB or HDMI portal. If interfaces are the same, we can plug and play different systems." (Piénsalo como un puerto USB o HDMI. Si las interfaces son iguales, podemos conectar y usar diferentes sistemas). Esto permite hubs MCP donde las herramientas pueden compartirse a través del ecosistema.
Los Desafíos de los que Nadie Quiere Hablar
El tutorial no evita los problemas reales:
De los incidentes de 2025:
- El agente de Replit eliminó producción después del code freeze (respuesta: "Lo siento, entré en pánico")
- Air Canada fue declarada responsable por el mal consejo de su chatbot
- Se reporta que $40 mil millones en productos de GenAI no están entregando valor de negocio
Sobre la complejidad de la evaluación: Hay tres capas para evaluar - el LLM en sí (alucinaciones, precisión), el sistema de agentes (selección de herramientas, completación de tareas), y la aplicación (latencia, costo, UX). Cada una requiere diferentes enfoques de evaluación.
Sobre los errores que se acumulan: Si un agente toma un camino equivocado en una tarea compleja, los errores se acumulan. A diferencia de los workflows con caminos predecibles, depurar agentes puede ser complicado.
¿Los Agentes te Quitarán el Trabajo? La Paradoja de Moravec
El estudio de Microsoft Research de julio de 2025 clasificó los trabajos por aplicabilidad de IA:
Alta aplicabilidad: Correctores de pruebas, editores, matemáticos, científicos de datos, desarrolladores web Baja aplicabilidad: Asistentes de enfermería, lavaplatos, techadores, pulidores de pisos
Esto se alinea con la paradoja de Moravec: lo que es difícil para los humanos es fácil para la IA, y viceversa. Los humanos gatean a los 6 meses, caminan al año. Estas son habilidades evolutivas antiguas. El ajedrez y la filosofía son nuevos y selectivos. La IA invierte esto - venció a campeones de ajedrez en 1997 pero todavía lucha por hacer que los robots caminen de manera confiable.
Consejos de Carrera para un Mundo de IA
Las conclusiones prácticas:
- Aprende IA, no le temas - Es una herramienta; cómo la usemos escribe el futuro
- Los fundamentos no desaparecen - Física, matemáticas, arquitectura, redes siguen siendo esenciales
- Sube la escalera de abstracción - Define problemas, diseña soluciones, adueñate de los resultados
- Piensa en sistemas - Las ventanas de contexto no son lo suficientemente grandes para bases de código completas
- Sé un polímata - Amplía tu base de conocimiento
- Encuentra nichos - La IA no hace bien lo de vanguardia o las ideas novedosas
- Enfócate en el elemento humano - Construye confianza, conexiones, redes
"AI is a junior assistant that's good with syntax but still needs a lot of guidance." (La IA es un asistente junior que es bueno con la sintaxis pero todavía necesita mucha guía). Trátala como tal.
8 Conclusiones de Este Curso Intensivo sobre IA Agentic
- Flujo de control dinámico - La característica definitoria que separa a los agentes de los workflows
- Cuatro componentes - Propósito, razonamiento (LLM), memoria y herramientas
- Usa workflows cuando - Misión crítica, determinístico, sensible al costo
- Usa agentes cuando - El rendimiento importa, el camino es complejo, el error es tolerable
- Primero un solo agente - El overhead multi-agente es real; evítalo si es posible
- Swarm vs supervisor - Swarm es más barato; supervisor es más fácil de depurar a escala
- La estandarización viene - MCP, A2A, AGUI creando interoperabilidad del ecosistema
- Elemento humano - Redes, confianza y conexiones son a prueba de IA
La Conclusión para Organizaciones que Despliegan Agentes de IA
Este es el recurso gratuito más completo sobre cómo construir agentes desde cero. El enfoque de Rola - mostrar el Python crudo antes de los frameworks - revela lo que LangChain y otras herramientas abstraen. Las comparaciones de costos entre arquitecturas proporcionan datos reales para decisiones arquitectónicas.
El campo tiene 2-3 años de antigüedad. Los frameworks cambian, los modelos se deprecan, las mejores prácticas evolucionan. Pero los fundamentos - bucles de planificar/actuar/observar, gestión de memoria, integración de herramientas, flujo de control dinámico - estos son patrones estables que vale la pena entender profundamente.


