Vibe physics: The AI grad student
Investigación que demuestra cómo Claude puede supervisar cálculos de investigación en física teórica de principio a fin, funcionando como un asistente de posgrado virtual. El estudio explora las capacidades de Claude para razonar sobre matemáticas avanzadas, verificar derivaciones y proponer nuevas vías de investigación.
Vibe Physics: Claude como asistente de posgrado en física teórica
Una nueva publicación del Anthropic Science Blog documenta un experimento ambicioso: usar Claude para supervisar cálculos de física teórica de forma autónoma, desde el planteamiento del problema hasta la verificación de los resultados.
El experimento
El equipo de investigación diseñó una serie de problemas de física teórica de dificultad creciente:
- Nivel básico: Derivaciones estándar de mecánica cuántica
- Nivel intermedio: Cálculos de teoría de campos
- Nivel avanzado: Problemas abiertos en física de partículas
Claude fue instruido para trabajar como un estudiante de doctorado: planteando hipótesis, realizando cálculos paso a paso y verificando sus propios resultados.
Resultados destacados
- Claude completó el 94% de las derivaciones de nivel básico sin errores
- En nivel intermedio, identificó correctamente sus propios errores en el 78% de los casos
- Para problemas avanzados, propuso 3 vías de investigación novedosas que los revisores consideraron prometedoras
Limitaciones identificadas
El estudio también documenta dónde falla Claude:
- Errores sistemáticos en ciertos tipos de integrales complejas
- Tendencia a sobre-simplificar en problemas con múltiples casos límite
- Dificultad para mantener la coherencia en derivaciones de más de 50 pasos
Implicaciones
Este trabajo sugiere que la IA ya puede actuar como colaborador en investigación científica, aunque requiere supervisión humana experta para validar los resultados más avanzados.
Fuente original
Ver en Anthropic