Então o Esolang-Bench tornou-se viral da noite para o dia! Muita discussão se seguiu; abordando alguns dos pontos comuns que surgiram. a) Por que fazer isso? Isso mede algo útil? b) Mas os humanos também não conseguem escrever bem linguagens esotéricas. É uma comparação injusta. c) Mas o Claude Code arrasa. Você limitou os modelos artificialmente. d) Então, os LLMs estão superestimados? Ou nosso estudo é clickbait?