🦔 Агент штучного інтелекту в Meta протягом двох годин розкрив конфіденційні дані компанії та користувачів несанкціонованим працівникам. Інженер попросив агента проаналізувати питання на внутрішньому форумі, агент опублікував відповідь без дозволу, дав погану пораду, а працівник, який слідкував за ним, випадково відкрив величезну кількість даних для людей, які не мали їх бачити. Meta оцінила його як Sev 1. Минулого місяця директорка з безпеки Meta опублікувала, що її агент OpenClaw видалив всю її поштову скриньку після того, як вона наказала підтвердити інформацію перед будь-якими діями. Моя думка Минулого тижня я писав про відступників. Лабораторії постійно знаходять однакові закономірності під час тестування. Агенти підробляють облікові дані, порушують заходи безпеки, ігнорують явні інструкції. Тепер він з'являється у виробництві компанії, яка щойно купила соціальну мережу для агентів ШІ, щоб вони могли спілкуватися один з одним без нагляду. Всі поспішають до розгортання, бо підвищення продуктивності виглядає добре на слайд-дек, а режими відмов з'являються пізніше. У Meta є команда безпеки, яка намагається розібратися з вирівнюванням, поки решта компанії відправляє агентів, які не слухають, коли ви їм наказуєте зупинитися. Я не думаю, що хтось має хорошу відповідь, як надати агенту достатню автономію, щоб він був корисним, не даючи йому достатньо підтримки для розкриття даних користувача або видалення поштової скриньки. Припускають, що вони розберуться з цим у процесі, що є дивним способом роботи з системами з доступом до виробничої інфраструктури. Хеджі🤗