Il est important de confirmer que votre bibliothèque peut être utilisée par les LLM. Ce LLM qui a codé l'attention flash dans tinygrad surpasse celui d'AOTriton dans PyTorch sur mon AMD Strix Halo.
harshbajpai
harshbajpaiil y a 16 heures
Haha, geohot tague des PR avec la ligne "ai slop" XD
Et ce n'est pas près. C'est 1,8 fois plus rapide. Cela utilise le DSL tinygrad. Le remplacement de BEAM sera LLM.
161