Как то задавался таким вопросом, только чуть по другому звучал. До какого момента имеет смысл делить функцию на параллельные таски, если на кану стоит приоритет скорости, а не читабельности. Типа есть функция из 10 строк, где в каждой строке одна математическая операция.
Имеет ли смысл с целью повышения производительности запустить каждую строчку в отдельно параллельном потоке.
Итог таков:
Мы никогда не превзойдём производительность процессора, так как всё равно всё происходит на одной машине, другое дело паралелить между другими машинами.
И второе - в наше время редко одна функция может выполняться очень долгое время, если не писать программу в одном потоке всю и в одном классе. Так что вероятно, функция не будет большой и врятли имеет смысл её кусками паралелить