AVISO: Si tienes varios Macbooks que soportan RDMA, puedes agruparlos usando @exolabs y ejecutar modelos 30B+ a 70 tok/s con thunderbolt5. El paralelismo tensorial en hardware de consumo es un problema resuelto. Estás alquilando GPUs peores que el portátil que tienes en el sofá. 2X M4 Max (64GB cada uno) ejecutando mlx-community/Qwen3-30B-A3B-4bit @ 70 TPS