É importante confirmar que a sua biblioteca pode ser utilizada por LLMs. A atenção flash codificada por LLM no tinygrad supera a do AOTriton no PyTorch na minha AMD Strix Halo.
harshbajpai
harshbajpaiHá 16 horas
Haha, geohot está a marcar PRs com a linha "ai slop" XD
E não está nem perto. É 1,8x mais rápido. Isto está a usar o DSL tinygrad. A substituição para BEAM será LLM.
175