Also, Esolang-Bench ist über Nacht viral gegangen! Es gab viele Diskussionen; hier sind einige der häufigsten Punkte, die angesprochen wurden. a) Warum das? Misst es etwas Nützliches? b) Aber Menschen können auch keine esoterischen Sprachen gut schreiben. Es ist ein unfairer Vergleich. c) Aber Claude Code rockt das. Du hast die Modelle künstlich limitiert. d) Sind LLMs also überbewertet? Oder ist unsere Studie Clickbait?