È importante confermare che la tua libreria può essere utilizzata da LLM. Quel LLM che ha codificato l'attenzione flash in tinygrad supera quello di AOTriton in PyTorch sulla mia AMD Strix Halo.
harshbajpai
harshbajpai16 ore fa
Haha, geohot sta etichettando le PR con la frase "ai slop" XD
E non è nemmeno vicino. È 1,8 volte più veloce. Questo utilizza il DSL di tinygrad. Il sostituto di BEAM sarà LLM.
173