EVMbenchではシングルエージェントAIの最高46.7%です。FailSafeは専門エージェントの群れを動員して脅威モデルのマッピングと結果の相互検証を行い、この初回のリコール率は69.2%(120件中83件の脆弱性が特定)に押し上げられています。 オープンソースリポジトリの仕組みを確認してください: