Término
Regresión
Degradación silenciosa del agente tras un cambio.
Situación en que un cambio aparentemente inofensivo (nueva versión del modelo, prompt ajustado, nueva herramienta) empeora el comportamiento del agente en casos previos. Se detecta con un set de evals que se ejecutan automáticamente en CI. Sin evals, las regresiones solo se descubren cuando las detecta un cliente.
Relacionados
