1/ У нас кризис масштабирования аппаратного обеспечения. Ядра тензоров GPU удваивают свою скорость, но пропускная способность памяти и экспоненциальные математические блоки стагнируют. Ваши ядра внимания простаивают в ожидании завершения базовых математических операций. 🧵