A IA de agente único atinge um máximo de 46,7% no EVMbench. O FailSafe organiza um enxame de agentes especializados para mapear modelos de ameaças e validar os achados cruzados, elevando o recall para essa primeira sequência para 69,2% (83/120 vulnerabilidades identificadas). Confira o repositório open-source para ver como funciona: