ClawBio logoHackathon ClawBio Madrid

Genómica Agéntica

Agentes de IA para Salud y Genómica

Dr. Manuel Corpas, University of Westminster, 20 de mayo de 2026, Madrid

Ingeniería agéntica: la nueva frontera

La biología se ha convertido en una ciencia saturada de datos. Las herramientas para analizarlos no han seguido el ritmo.

Un solo genoma humano produce tres mil millones de pares de bases. La interpretación clínica requiere alineamiento, llamada de variantes, anotación funcional, cruce con la literatura y síntesis en informes accionables. Cada paso depende de software especializado con sus propias dependencias, historiales de versión y requisitos de configuración.

Los gestores de flujos de trabajo (Nextflow, Snakemake, Galaxy) surgieron porque la orquestación manual es insostenible. Aun así, un biólogo que quiera analizar sus propios datos de secuenciación debe aprender a programar, contratar a alguien que sepa, o depender de interfaces gráficas que pueden no soportar el análisis que necesita.

Los modelos ya son suficientemente buenos. El arnés, no.

Los LLM modernos pueden escribir, depurar y ejecutar código. Pueden planificar operaciones de varios pasos, adaptarse en función de resultados intermedios y coordinar decenas de herramientas.

Pero un LLM de propósito general generando código de bioinformática desde cero es poco fiable. La salida varía entre sesiones. Carece de la especificidad que los expertos del dominio incorporan a los flujos de trabajo durante años. Alucina asociaciones gen-fármaco e inventa clasificaciones de variantes.

El problema no es el modelo. El problema es el arnés: qué restringe al modelo, qué herramientas puede invocar, qué barreras evitan errores silenciosos. La ingeniería agéntica es la disciplina de construir ese arnés.

¿Qué es la IA agéntica?

La primera ola de LLM en ciencias de la vida fue recuperación de información: resumir artículos, responder preguntas sobre rutas metabólicas, extraer datos estructurados de texto. Útil, pero incremental.

La segunda ola es cualitativamente distinta. Cuando se conectan a sistemas de archivos, bases de datos y herramientas de línea de comandos, los LLM se convierten en agentes autónomos que planifican operaciones de varios pasos, las ejecutan y se adaptan en función de resultados intermedios.

El cambio: de una IA que te cuenta cosas a una IA que hace cosas. El papel del investigador pasa de construir el análisis a evaluarlo.

¿Qué es un agente?

La genómica agéntica es el uso de agentes de IA autónomos, impulsados por grandes modelos de lenguaje y operando dentro de bibliotecas de skills restringidas al dominio, para descubrir, planificar, ejecutar y refinar de forma iterativa análisis genómicos de varios pasos, en los que el agente decide en tiempo de ejecución sobre la selección de herramientas, la parametrización, el manejo de errores y la evaluación de resultados.

Corpas, Fatumo, Guio. "Agentic Genomics: From Pipeline Automation to Autonomous Validation."

Cuatro condiciones necesarias: autonomía (decisiones en tiempo de ejecución), restricción al dominio (bibliotecas de skills, no código ad hoc), refinamiento iterativo (diagnóstico y auto-reparación de errores) y mediación en lenguaje natural (no se requiere programar).

¿Cómo funciona?

Flujo tradicional

  • El investigador escribe el código
  • Configura las herramientas a mano
  • Ejecuta el pipeline
  • Interpreta los resultados

Cuello de botella: producir código

Flujo agéntico

  • El investigador describe la intención en lenguaje natural
  • El agente descubre y ejecuta skills de una biblioteca
  • El agente gestiona errores y se adapta
  • El investigador valida los resultados

Cuello de botella: validación y juicio

¿Por qué resulta útil?

MétricaDirigido por personaMediado por agente
Tiempo de puesta en marcha2 a 4 horas5 a 15 minutos
Supervisión requeridaContinuaMínima (el agente gestiona errores)
ReproducibilidadVariableAlta (la especificación del skill es fija)
Recuperación ante erroresDepuración manualDiagnóstico y reparación automáticos
Experiencia previa necesariaFormación en bioinformáticaConocimiento del dominio para validar
Modo principal de falloErrores de configuración, conflictos de versiónErrores silenciosos con apariencia plausible

Análisis comparativo sobre flujos de exoma y scRNA-seq (Corpas, Fatumo, Guio).

¿Cómo se aplica esto a la genómica?

¿Qué es ClawBio?

Un toolkit open-source de skills para agentes de IA aplicados al análisis genómico.

Un skill es una unidad autocontenida y versionada de funcionalidad bioinformática: un contrato SKILL.md que encapsula código, configuración, referencias a datos, especificaciones de entrada y salida, y suites de tests. La IA lee el contrato; nunca lo sobrescribe.

40+skills bioinformáticos
750+estrellas en GitHub
200plazas hoy en Madrid
0coste

Tracks del hackathon de hoy

Desarrollo de nuevos skills

Añade un skill bioinformático a ClawBio: anotación de variantes, análisis de rutas, informes clínicos, farmacogenómica, o tu propia idea.

Flujos de trabajo con agentes

Encadena varios skills para resolver una pregunta genómica de varios pasos, de la muestra al informe.

Equidad y acceso

Usa el framework HEIM de puntuación de equidad para auditar brechas de representación en datasets genómicos.

No se requiere experiencia previa en bioinformática. Emparejamos expertos del dominio con personas que saben programar. Trae portátil y ganas de aprender.

¿Cuáles son las limitaciones?

La genómica agéntica reduce la barrera para generar análisis. No reduce la barrera para evaluarlos.

Errores silenciosos plausibles

El modo de fallo principal: resultados que parecen correctos pero no lo son. Un skill devolvió "todo normal" en farmacogenómica para un archivo de entrada vacío.

Alucinación

Los agentes pueden citar asociaciones gen-enfermedad inexistentes, fabricar referencias o generar anotaciones que mezclan loci no relacionados.

Sesgo de equidad

Los agentes recurren por defecto a recursos de ancestría europea. El 86% de los datos GWAS son europeos. La genómica agéntica puede automatizar sesgos existentes a escala.

Brecha de validación

La experiencia del dominio que se construye en años no se atajan con IA. Un usuario novato no detectará los errores que sí vería un analista experimentado.

La democratización es real, pero parcial. Amplía la capacidad de producir; no amplía la capacidad de juzgar.

Democratizando la genómica

La barrera de infraestructura ya no existe.

Sin HPC

Todo corre en tu propio portátil o en Google Colab gratuito.

Sin acuerdos de acceso a datos

Las estadísticas resumen son públicas. Sin solicitudes, sin esperas.

Sin equipo de bioinformática

ClawBio envuelve el pipeline completo. Un comando por análisis.

Sin coste

Licencia MIT. Bases de datos públicas. Cero gasto en infraestructura.

Un investigador en Lima, Kampala o Madrid puede correr los mismos análisis que uno en el Broad Institute. Hoy.

Pensado con el Sur Global en mente

Este hackathon se apoya en investigación desarrollada con Prof. Segun Fatumo (Queen Mary University of London, PHURI) y la red LatinOMICS, en torno a eliminar las barreras que mantienen la genómica concentrada en instituciones ricas:

Infraestructura HPC

Reemplazada por portátil o Google Colab. Cero setup, cero coste, funciona en cualquier sitio con navegador.

Acceso a datos

Las estadísticas resumen públicas cubren la mayoría de análisis comunes. Sin filtros institucionales.

Formación

Talleres abiertos, materiales abiertos, código abierto. Cualquier investigador puede correr análisis con calidad publicable.

Mañana y pasado, en esta misma sede, el III Congreso Español de Medicina Genómica incluye la sesión LatinOMICS 2 completa y la Declaración de Medellín.

Manos a la obra

¿Cómo empiezo?

Instala ClawBio y entra en el grupo de WhatsApp

Programa de hoy

HoraQué pasa
12:00Llegada y registro
12:30Introducción a ClawBio y briefing de los retos
13:00Formación de equipos y comienza el hackathon
15:00Pausa café
15:15Continúa el hackathon
16:30Demos y evaluación
17:30Premios y networking
18:00Cierre

Premios: mejor nuevo skill, mejor flujo de trabajo con agentes y mejor hack de equidad. Detalles a las 16:30.

Cómo empezar ahora mismo

Tres enlaces, abre cada uno en una pestaña nueva:

Introducción a ClawBio

Presentación técnica en castellano sobre genómica agéntica, validación y el benchmark de farmacogenómica.

presentations/genomica-agentica-es

Taller práctico

Anota un genoma humano real en Google Colab. Sin instalación. En castellano.

tutorials/variant-interpretation-workshop-es

Repositorio de ClawBio

El código que vais a extender hoy. Pon estrella, clona, instala.

github.com/ClawBio/ClawBio

Grupo de WhatsApp del hackathon: chat.whatsapp.com/FInuUxJa00G7Ql3T28kW4I. Comparte ahí cualquier duda y los enlaces a tu repo.

Mensajes para llevarte a casa

  1. La IA acelera los pasos mecánicos, pero la experiencia del dominio en biología molecular, genética y contexto clínico sigue siendo imprescindible.
  2. La farmacogenómica salva vidas hoy. Interacciones como warfarina/CYP2C9/VKORC1 ya están implementadas en hospitales.
  3. "Aún no lo sabemos" es una respuesta válida. Más de la mitad de las variantes son de significado incierto. La incertidumbre honesta es una fortaleza.
  4. El análisis transancestral no es opcional. Comprueba siempre si los hallazgos se transfieren entre poblaciones.
  5. La infraestructura ya no es la barrera. ClawBio en tu portátil más Google Colab dan análisis de calidad publicable, gratis, en cualquier sitio.

Únete a la comunidad

WhatsApp

Únete al grupo para dudas, actualizaciones y futuros eventos.

Grupo de WhatsApp

Discord

Habla con RoboTerri, comparte resultados y colabora con otros usuarios.

Servidor de Discord

GitHub

Pon estrella al repo, abre issues, contribuye skills. Todo bajo licencia MIT.

ClawBio/ClawBio

Mañana y pasado, en esta misma sede

III Congreso Español de Medicina Genómica, 21 y 22 de mayo.

Si ya estás en Madrid, dos días más cubren tres tracks: medicina genómica clínica, LatinOMICS y IA con infraestructuras europeas.

Ponentes destacados

Ángel Carracedo (USC), Alfonso Valencia (BSC), Khalid Fakhro (Sidra Medicine, Qatar), Carmen Ayuso (Fundación Jiménez Díaz), Pablo Lapunzina (La Paz), Alfredo Iacoangeli (KCL), Silvia Alvarez (Regeneron).

Precios reducidos

Presencial 95 EUR, online 60 EUR. Precio único, sin categorías.

Recursos

RecursoEnlace
Esta presentación (hackathon)presentations/hackathon-madrid-mayo-2026
Introducción a ClawBio (charla técnica)presentations/genomica-agentica-es
Taller práctico (Colab + código)tutorials/variant-interpretation-workshop-es
ClawBio en GitHubgithub.com/ClawBio/ClawBio
Corpasome (Zenodo)doi:10.5281/zenodo.19297389
Grupo de WhatsAppWhatsApp
Congreso Genómica 2026congresogenomica.com

github.com/ClawBio/ClawBio