Término
Latencia
Tiempo que tarda el agente en responder o completar una tarea.
Tiempo desde que se pide al agente actuar hasta que termina. Compuesta por: llamadas al modelo (segundos a decenas), llamadas a APIs externas (variables), y aprobaciones humanas cuando hay HITL (minutos a horas). Un agente bien diseñado paraleliza llamadas y cachea resultados para minimizar latencia acumulada.
Relacionados
