Нам потрібні нові бенчмарки для низькоскладних рішень задач коду. Кожна нова функція — це як блок дженга у вежі, а поточні бенчмарки оцінюють лише якість складання кожного блоку. Нам потрібні оцінки, які відстежують, наскільки висотою можна складати блоки до обвалу вежі.