Телеграмм чат группы proalgorithms страница 3480

вот это зачем нужно:
(Te4[(temp >> 16) & 0xff] & 0xff000000) ^
(Te4[(temp >> 8) & 0xff] & 0x00ff0000) ^
(Te4[(temp ) & 0xff] & 0x0000ff00) ^
(Te4[(temp >> 24) ] & 0x000000ff) ^

источник

13:39пожаловаться #10

Dim in pro.algorithms

это же побайтная обработка!

источник

13:39пожаловаться #11

Aragaer in pro.algorithms

потому что это эквивалентно побайтной обработке, но на реальных процессорах вполне могут оказаться инструкции, которые ровно вот это делают совсем иначе

источник

13:47пожаловаться #12

Aragaer in pro.algorithms

например на powerpc я видел инструкцию "сделать сдвиг и наложить маску". Тогда тут было бы четыре вызова этой инструкции плюс ксоры. Но эта инструкция принимает 32-битное слово, а не один байт

источник

13:48пожаловаться #13

Dim in pro.algorithms

Aragaer

по твоему мнению тут оптимизация очевидна по сравнению с 8ми битной версией?

источник

13:49пожаловаться #14

Dim in pro.algorithms

https://github.com/Skycker/AES

GitHub

Skycker/AES

Implementation of Rijndael cipher algorithm. Contribute to Skycker/AES development by creating an account on GitHub.

источник

13:51пожаловаться #15

Dim in pro.algorithms

вот она

источник

13:51пожаловаться #16

Aragaer in pro.algorithms

В данном случае она по крайней мере не хуже наивного побайтного подхода.

источник

13:51пожаловаться #17

Dim in pro.algorithms

а именно?

источник

13:52пожаловаться #18

Aragaer in pro.algorithms

я просто отталкиваюсь от своего опыта, когда я видел реализацию strlen для юникодных строк. Наивная реализация это просто пройтись по байтам, оптимизированная это неоновские интринсики для векторных операций.

источник

13:52пожаловаться #19

Aragaer in pro.algorithms

но для векторных операций помимо собственно работы требовалось также сначала инициализировать нужные данные, а в конце выгрести результат. В итоге экспериментально было получено, что для строк длиной менее 13 байт наивная реализация работает быстрее

источник

13:53пожаловаться #20