🔬 Feynman: Automatización Extrema de la Investigación AI
Feynman no es simplemente otro chatbot; es una implementación sofisticada de agentes autónomos diseñada para colapsar las semanas de trabajo de un ingeniero de ML en horas de ejecución orquestada. El proyecto propone un cambio de paradigma: pasar de la IA como asistente de chat a la IA como colega de investigación capaz de auditar código y ejecutar experimentos.
🛡️ Arquitectura Multi-Agente y Orquestación
La robustez de Feynman reside en su capacidad para despachar agentes especializados que operan bajo una lógica de separación de preocupaciones (Separation of Concerns):
- Researcher Agent: Encargado del descubrimiento de literatura y la síntesis de conceptos clave mediante integraciones con alphaXiv.
- Reviewer & Verifier Agents: Módulos críticos que validan las premisas técnicas de los papers contra la realidad del código fuente.
- Writer Agent: Encargado de estructurar los hallazgos en reportes técnicos listos para consumo humano.
- Skills System: La lógica del agente se define mediante archivos Markdown (“skills”), lo que permite una extensibilidad desacoplada del core del motor.
💻 Capacidades Técnicas Críticas
El repositorio destaca por funcionalidades que abordan directamente los problemas de reproducibilidad en el campo de la Inteligencia Artificial:
/auditCommand: Realiza un análisis cruzado entre las afirmaciones de un paper de investigación y el repositorio de código asociado, identificando discrepancias técnicas o “vendehumismo” académico.- Grounding de Fuentes: Cada output generado mantiene una trazabilidad estricta con URLs directas a documentación oficial y citas de arXiv, eliminando el riesgo de alucinaciones no verificadas.
- Orquestación en Pi: Utiliza el runtime de Pi para la ejecución de agentes, permitiendo una gestión de estado eficiente durante ciclos largos de investigación.
🚀 Infraestructura y Replicación de Experimentos
Uno de los puntos más disruptivos de Feynman es su capacidad para “bajar a tierra” la teoría mediante la automatización del cómputo:
- Abstracción de GPU: Integración nativa con Modal y RunPod, permitiendo al agente levantar infraestructura bajo demanda para replicar modelos.
- Containerización Local: Soporte para Docker, asegurando que el código de investigación se ejecute en entornos aislados y controlados.
- Loop de Auto-Investigación: El comando
/autoresearchhabilita un ciclo autónomo donde el agente refina sus propios experimentos basándose en los resultados previos.
📝 Análisis de Ingeniería Senior
Desde una perspectiva de sistemas, Feynman resuelve el cuello de botella más grande del ingeniero de AI: el “Time-to-Code”. La capacidad de automatizar la lectura de papers y, simultáneamente, preparar el entorno de ejecución para probar esos mismos papers es el “Santo Grial” de la productividad en I+D. La elección de TypeScript para el core asegura una base de código tipada y mantenible, mientras que la lógica de “Skills” en Markdown facilita la democratización de la personalización de los agentes sin necesidad de reescribir la lógica de orquestación principal.