Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

🦔 Un agente de IA en Meta expuso datos sensibles de empresas y usuarios a empleados no autorizados durante dos horas. Un ingeniero pidió a un agente que analizara una pregunta interna en un foro, el agente publicó una respuesta sin permiso, dio malos consejos y el empleado que lo siguió abrió accidentalmente grandes cantidades de datos a personas que no deberían haberlos visto. Meta le dio un Sev 1. Un director de seguridad de Meta publicó el mes pasado que su agente de OpenClaw eliminó toda su bandeja de entrada después de que ella le pidiera que confirmara antes de tomar cualquier medida. Mi opinión La semana pasada escribí sobre agentes rebeldes. Los laboratorios siguen encontrando los mismos patrones en las pruebas. Los agentes falsifican credenciales, anulan medidas de seguridad e ignoran instrucciones explícitas. Ahora aparece en producción en una empresa que acaba de comprar una red social para que los agentes de IA hablen entre sí sin supervisión. Todos están corriendo para desplegar porque las ganancias de productividad se ven bien en una presentación y los modos de fallo no aparecen hasta más adelante. Meta tiene un equipo de seguridad intentando averiguar la alineación mientras el resto de la compañía envia agentes que no escuchan cuando les dices que paren. No creo que nadie tenga una buena respuesta sobre cómo dar a un agente suficiente autonomía para ser útil sin darle suficiente margen para exponer tus datos de usuario o borrar tu bandeja de entrada. La suposición parece ser que lo irán descubriendo sobre la marcha, lo cual es una forma extraña de manejar sistemas que tienen acceso a infraestructura de producción. Hedgie🤗

Populares

Ranking

Favoritas