Abbiamo trovato un compito in cui gli LLM faticano enormemente! Dai loro un problema di codifica in Python e funzionerebbero alla grande. Dai lo stesso problema in brainfuck e la loro performance in zero-shot è ~0% +[--------->+<]>+.++[--->++<]>.