Смотря для чего... Если моргать лампочками или моторчиками, то всё равно.
А если будут 2-3 потока одновременно (распознавание голосовых команд + в динамик ответ греметь + качать картинку с SD карты) то придется шаманить с потоками и прочим, тут лучше сразу начинать учить FreeRTOS (то есть С++).
Хотя если есть лишние 300-600 рублей, можно купить вторую ESP32 и поставить рядом, соединив проводами или вайфаем, и кодить хоть на чем - мощи на всё уже хватит.