Paper2Poster: Ingeniería de Diseño Multi-Agente para la Ciencia
El repositorio oficial de Paper2Poster, presentado en NeurIPS 2025, ofrece un ecosistema de código abierto diseñado para automatizar la creación de pósteres científicos a partir de artículos de investigación en PDF. Su innovación técnica reside en la arquitectura PosterAgent, un sistema multi-agente que utiliza un 87% menos de tokens que modelos comerciales generalistas, logrando una coherencia estructural y estética superior.
🔬 Arquitectura Técnica: PosterAgent
El framework implementa una filosofía de diseño Top-down dividida en tres agentes especializados que colaboran de forma iterativa:
- Parser (Extracción y Análisis): Utiliza motores como
markeroDoclingpara convertir el PDF técnico a Markdown. Un LLM procesa el documento para generar resúmenes por secciones y estructurar una “biblioteca de activos” que vincula texto con sus respectivas figuras y tablas. - Planner (Estrategia Espacial): Organiza los activos mediante una estructura de árbol binario. Empareja semánticamente los contenidos y asigna el espacio en los paneles basándose en la densidad de información, garantizando un equilibrio visual y un flujo de lectura lógico.
- Painter-Commenter Loop (Refinamiento Visual): Un ciclo cerrado donde el agente Painter renderiza el diseño y el Commenter (un Modelo de Lenguaje Visual o VLM) audita el resultado. El VLM detecta desalineaciones, desbordamientos de texto o falta de contraste, enviando correcciones hasta que el póster cumple con los estándares estéticos y técnicos.
🚀 Capacidades y Evaluación (Paper2Poster Benchmark)
El proyecto introduce métricas disruptivas para validar la transferencia de conocimiento:
- PaperQuiz: Genera preguntas de opción múltiple sobre el paper original. Se solicita a diferentes VLMs que las respondan utilizando únicamente el póster generado. Un alto porcentaje de aciertos valida que el póster comunica la ciencia de forma efectiva.
- Eficiencia de Coste: Capaz de transformar un artículo de más de 20 páginas en un diseño editable (
.pptx) por un coste aproximado de $0.005 USD. - Interoperabilidad: Compatible con modelos locales de pesos abiertos (vía
vLLM) como Qwen-2.5, permitiendo una ejecución privada y económica.
⚖️ Problemas que Resuelve
Paper2Poster aborda la fricción técnica y creativa en la comunicación científica. Al automatizar la jerarquización de la información compleja y asegurar un diseño profesional bajo estándares de conferencias, democratiza la capacidad de los investigadores para producir material visual de alto impacto, facilitando la difusión del conocimiento científico de manera accesible y escalable.