Hackathon ClawBio MadridAgentes de IA para Salud y Genómica
Dr. Manuel Corpas, University of Westminster, 20 de mayo de 2026, Madrid
La biología se ha convertido en una ciencia saturada de datos. Las herramientas para analizarlos no han seguido el ritmo.
Un solo genoma humano produce tres mil millones de pares de bases. La interpretación clínica requiere alineamiento, llamada de variantes, anotación funcional, cruce con la literatura y síntesis en informes accionables. Cada paso depende de software especializado con sus propias dependencias, historiales de versión y requisitos de configuración.
Los gestores de flujos de trabajo (Nextflow, Snakemake, Galaxy) surgieron porque la orquestación manual es insostenible. Aun así, un biólogo que quiera analizar sus propios datos de secuenciación debe aprender a programar, contratar a alguien que sepa, o depender de interfaces gráficas que pueden no soportar el análisis que necesita.
Los LLM modernos pueden escribir, depurar y ejecutar código. Pueden planificar operaciones de varios pasos, adaptarse en función de resultados intermedios y coordinar decenas de herramientas.
Pero un LLM de propósito general generando código de bioinformática desde cero es poco fiable. La salida varía entre sesiones. Carece de la especificidad que los expertos del dominio incorporan a los flujos de trabajo durante años. Alucina asociaciones gen-fármaco e inventa clasificaciones de variantes.
El problema no es el modelo. El problema es el arnés: qué restringe al modelo, qué herramientas puede invocar, qué barreras evitan errores silenciosos. La ingeniería agéntica es la disciplina de construir ese arnés.
La primera ola de LLM en ciencias de la vida fue recuperación de información: resumir artículos, responder preguntas sobre rutas metabólicas, extraer datos estructurados de texto. Útil, pero incremental.
La segunda ola es cualitativamente distinta. Cuando se conectan a sistemas de archivos, bases de datos y herramientas de línea de comandos, los LLM se convierten en agentes autónomos que planifican operaciones de varios pasos, las ejecutan y se adaptan en función de resultados intermedios.
El cambio: de una IA que te cuenta cosas a una IA que hace cosas. El papel del investigador pasa de construir el análisis a evaluarlo.
La genómica agéntica es el uso de agentes de IA autónomos, impulsados por grandes modelos de lenguaje y operando dentro de bibliotecas de skills restringidas al dominio, para descubrir, planificar, ejecutar y refinar de forma iterativa análisis genómicos de varios pasos, en los que el agente decide en tiempo de ejecución sobre la selección de herramientas, la parametrización, el manejo de errores y la evaluación de resultados.
Corpas, Fatumo, Guio. "Agentic Genomics: From Pipeline Automation to Autonomous Validation."
Cuatro condiciones necesarias: autonomía (decisiones en tiempo de ejecución), restricción al dominio (bibliotecas de skills, no código ad hoc), refinamiento iterativo (diagnóstico y auto-reparación de errores) y mediación en lenguaje natural (no se requiere programar).
Cuello de botella: producir código
Cuello de botella: validación y juicio
| Métrica | Dirigido por persona | Mediado por agente |
|---|---|---|
| Tiempo de puesta en marcha | 2 a 4 horas | 5 a 15 minutos |
| Supervisión requerida | Continua | Mínima (el agente gestiona errores) |
| Reproducibilidad | Variable | Alta (la especificación del skill es fija) |
| Recuperación ante errores | Depuración manual | Diagnóstico y reparación automáticos |
| Experiencia previa necesaria | Formación en bioinformática | Conocimiento del dominio para validar |
| Modo principal de fallo | Errores de configuración, conflictos de versión | Errores silenciosos con apariencia plausible |
Análisis comparativo sobre flujos de exoma y scRNA-seq (Corpas, Fatumo, Guio).
Un toolkit open-source de skills para agentes de IA aplicados al análisis genómico.
Un skill es una unidad autocontenida y versionada de funcionalidad bioinformática: un contrato SKILL.md que encapsula código, configuración, referencias a datos, especificaciones de entrada y salida, y suites de tests. La IA lee el contrato; nunca lo sobrescribe.
Añade un skill bioinformático a ClawBio: anotación de variantes, análisis de rutas, informes clínicos, farmacogenómica, o tu propia idea.
Encadena varios skills para resolver una pregunta genómica de varios pasos, de la muestra al informe.
Usa el framework HEIM de puntuación de equidad para auditar brechas de representación en datasets genómicos.
No se requiere experiencia previa en bioinformática. Emparejamos expertos del dominio con personas que saben programar. Trae portátil y ganas de aprender.
La genómica agéntica reduce la barrera para generar análisis. No reduce la barrera para evaluarlos.
El modo de fallo principal: resultados que parecen correctos pero no lo son. Un skill devolvió "todo normal" en farmacogenómica para un archivo de entrada vacío.
Los agentes pueden citar asociaciones gen-enfermedad inexistentes, fabricar referencias o generar anotaciones que mezclan loci no relacionados.
Los agentes recurren por defecto a recursos de ancestría europea. El 86% de los datos GWAS son europeos. La genómica agéntica puede automatizar sesgos existentes a escala.
La experiencia del dominio que se construye en años no se atajan con IA. Un usuario novato no detectará los errores que sí vería un analista experimentado.
La democratización es real, pero parcial. Amplía la capacidad de producir; no amplía la capacidad de juzgar.
La barrera de infraestructura ya no existe.
Todo corre en tu propio portátil o en Google Colab gratuito.
Las estadísticas resumen son públicas. Sin solicitudes, sin esperas.
ClawBio envuelve el pipeline completo. Un comando por análisis.
Licencia MIT. Bases de datos públicas. Cero gasto en infraestructura.
Un investigador en Lima, Kampala o Madrid puede correr los mismos análisis que uno en el Broad Institute. Hoy.
Este hackathon se apoya en investigación desarrollada con Prof. Segun Fatumo (Queen Mary University of London, PHURI) y la red LatinOMICS, en torno a eliminar las barreras que mantienen la genómica concentrada en instituciones ricas:
Reemplazada por portátil o Google Colab. Cero setup, cero coste, funciona en cualquier sitio con navegador.
Las estadísticas resumen públicas cubren la mayoría de análisis comunes. Sin filtros institucionales.
Talleres abiertos, materiales abiertos, código abierto. Cualquier investigador puede correr análisis con calidad publicable.
Mañana y pasado, en esta misma sede, el III Congreso Español de Medicina Genómica incluye la sesión LatinOMICS 2 completa y la Declaración de Medellín.
Manos a la obra
Instala ClawBio y entra en el grupo de WhatsApp
| Hora | Qué pasa |
|---|---|
| 12:00 | Llegada y registro |
| 12:30 | Introducción a ClawBio y briefing de los retos |
| 13:00 | Formación de equipos y comienza el hackathon |
| 15:00 | Pausa café |
| 15:15 | Continúa el hackathon |
| 16:30 | Demos y evaluación |
| 17:30 | Premios y networking |
| 18:00 | Cierre |
Premios: mejor nuevo skill, mejor flujo de trabajo con agentes y mejor hack de equidad. Detalles a las 16:30.
Tres enlaces, abre cada uno en una pestaña nueva:
Presentación técnica en castellano sobre genómica agéntica, validación y el benchmark de farmacogenómica.
Anota un genoma humano real en Google Colab. Sin instalación. En castellano.
El código que vais a extender hoy. Pon estrella, clona, instala.
Grupo de WhatsApp del hackathon: chat.whatsapp.com/FInuUxJa00G7Ql3T28kW4I. Comparte ahí cualquier duda y los enlaces a tu repo.
Pon estrella al repo, abre issues, contribuye skills. Todo bajo licencia MIT.
III Congreso Español de Medicina Genómica, 21 y 22 de mayo.
Si ya estás en Madrid, dos días más cubren tres tracks: medicina genómica clínica, LatinOMICS y IA con infraestructuras europeas.
Ángel Carracedo (USC), Alfonso Valencia (BSC), Khalid Fakhro (Sidra Medicine, Qatar), Carmen Ayuso (Fundación Jiménez Díaz), Pablo Lapunzina (La Paz), Alfredo Iacoangeli (KCL), Silvia Alvarez (Regeneron).
Presencial 95 EUR, online 60 EUR. Precio único, sin categorías.
Inscripción: congresogenomica.com/inscripcion | Programa: congresogenomica.com/programa_congreso
| Recurso | Enlace |
|---|---|
| Esta presentación (hackathon) | presentations/hackathon-madrid-mayo-2026 |
| Introducción a ClawBio (charla técnica) | presentations/genomica-agentica-es |
| Taller práctico (Colab + código) | tutorials/variant-interpretation-workshop-es |
| ClawBio en GitHub | github.com/ClawBio/ClawBio |
| Corpasome (Zenodo) | doi:10.5281/zenodo.19297389 |
| Grupo de WhatsApp | |
| Congreso Genómica 2026 | congresogenomica.com |
github.com/ClawBio/ClawBio