Там можно в нибблы конвертить по 128 бит исходных данных в 256 выходных, а можно 64 исходных в выходной результат \хНМ, а можно вставлять \х во втором проходе, не знаю куда воевать, бенчмаркать времени нет :(
Я бы сделал первый вариант в первую очередь, и потом пробовал, помогает ли добавлять второй проход с добавлением \x, если останется время