О нет, тут именно примеры как распараллелить такие алгорится, а соответственно их ускорить - на сегодняшний день это делают через такие фокусы (на мобилки - android - это Compute shader, у apple есть свой прямой аналог), это сродни Cuda для карт nVidia. И чтобы понять профит, средняя видеокарта (на andriod) сегодня поддерживает 1024 операций (invocation) в рабочей группе, максимальное количество рабочих групп - 65535