
Sebastian Raschka
Staff Research Engineer
Sobre Sebastian Raschka
Sebastian Raschka es Staff Research Engineer en Lightning AI y uno de los educadores mas influyentes en la comunidad de aprendizaje automatico. Es autor de varios libros de texto ampliamente utilizados, incluyendo Build a Large Language Model from Scratch y Build a Reasoning Model from Scratch — libros que encarnan la filosofia de que la mejor manera de entender la IA es implementarla tu mismo.
Anteriormente Profesor Asistente de Estadistica en la Universidad de Wisconsin-Madison (2018-2023), Raschka dejo la academia para enfocarse de tiempo completo en la investigacion y desarrollo de LLM en Lightning AI. Su trabajo cierra la brecha entre la investigacion de vanguardia y la implementacion practica, haciendo accesibles temas complejos a traves de explicaciones basadas en codigo.
Su newsletter Ahead of AI y sus cursos educativos en YouTube lo han convertido en un recurso imprescindible para los profesionales que quieren entender como funcionan realmente los LLM a nivel de implementacion.
Trayectoria profesional
- Staff Research Engineer en Lightning AI (2022-presente)
- Ex Profesor Asistente de Estadistica, Universidad de Wisconsin-Madison (2018-2023)
- Autor de Build a Large Language Model from Scratch (bestseller)
- Autor de Build a Reasoning Model from Scratch
- Autor de Machine Learning with PyTorch and Scikit-Learn
- Creador de la newsletter Ahead of AI y cursos educativos
- Mas de 10 anos de experiencia en investigacion e ingenieria de IA
Posiciones destacadas
Sobre la competencia en IA en 2026
Raschka argumenta en contra de la narrativa de que un solo actor se lleva todo en IA, enfatizando que las ideas ya no son propietarias porque los investigadores se mueven entre empresas y laboratorios. La verdadera ventaja competitiva es el presupuesto de computo y el acceso a hardware, no las tecnicas secretas.
Sobre el desafio de la interfaz para los agentes
Plantea el problema fundamental de especificacion para los agentes autonomos: incluso si un LLM puede ejecutar tareas, como comunican los usuarios objetivos complejos en entornos no estructurados? La programacion funciona porque el entorno esta bien definido, pero los agentes de proposito general enfrentan un problema de diseno de interfaz mucho mas dificil.
Sobre el uso de herramientas de IA
Describe un enfoque pragmatico multi-modelo: el modo rapido de ChatGPT para consultas rapidas, el modo Pro para verificacion exhaustiva de documentos, y Gemini para tareas de contexto largo como encontrar datos especificos en documentos extensos. Usa el plugin Codex de VS Code para asistencia en programacion mientras mantiene el control del proceso.
Citas clave
- "I don't think nowadays in 2026 that there will be any company who has access to a technology that no other company has access to. Researchers are frequently changing jobs, changing labs, they rotate." (No creo que en 2026 haya alguna empresa que tenga acceso a una tecnologia a la que ninguna otra empresa tenga acceso. Los investigadores cambian frecuentemente de trabajo, de laboratorio, rotan.) — sobre la competencia en IA
- "The problem is for arbitrary tasks, you still have to specify what you want your LLM to do. What is the environment? How do you specify?" (El problema es que para tareas arbitrarias, todavia tienes que especificar lo que quieres que haga tu LLM. Cual es el entorno? Como lo especificas?) — sobre los agentes
- "I use it until it breaks and then I explore other options." (Lo uso hasta que falla y luego exploro otras opciones.) — sobre el cambio de modelos
Lectura relacionada
- Scaling Laws - Tema central en su analisis del progreso de la IA
- AI Agents - Discute el desafio de la especificacion
- Pre-training - Explica la importancia continua del computo de pre-entrenamiento
