Телеграмм чат группы proalgorithms страница 3937

вы не там ищете такты, открытая адресация с вынесенным заголовком даст выравнивание на 16, все слова лезут в 16, так что вы захотите использовать примерно три хешмапы - очень частых коротких слов, менее частых длиной 13 и всех остальных

источник

15:04пожаловаться #4

Constantine Drozdov in pro.algorithms

мы не перестановки, а слова языка хешируем

источник

15:04пожаловаться #5

Anatoly Tomilov in pro.algorithms

я так не пробовал. Но вариант с открытой адресацией — топовый

источник

15:05пожаловаться #6

Anatoly Tomilov in pro.algorithms

не все в том тексте. Там есть слово (а может быть и не одно) длиной в 70

источник

15:05пожаловаться #7

Constantine Drozdov in pro.algorithms

это UNLIKELY по куче причин, в частности из-за особенностей ввода мы можем обрабатывать это слово в 10 раз медленнее обычного

источник

15:06пожаловаться #8

Anatoly Tomilov in pro.algorithms

да. Но на if/switch, который будет диспатчить длину слова, будет тратиться CPU для каждого слова

источник

15:07пожаловаться #9

Anatoly Tomilov in pro.algorithms

задача — посчитать частоты слов именно в этом тексте, так что решение с perfect hash-ем годится

источник

15:10пожаловаться #10

Anatoly Tomilov in pro.algorithms

если сравнивать ещё и строки-ключи, то решения с хешмапой и двух секунд вряд ли преодолеют

источник

15:12пожаловаться #11

Constantine Drozdov in pro.algorithms

это ужасно (нет, потому что LIKELY первая ветка)

источник

15:26пожаловаться #12

Constantine Drozdov in pro.algorithms

вообще задача для просветления: задумано число N, запрос <=>, найти N за log N * (1 + o(1))

источник

15:27пожаловаться #13

Anatoly Tomilov in pro.algorithms

я пробовал оптимизации по длине слова — локально ухудшало. Может быть если сильно постараться, то это что-нибудь и даст (отдельная ветка для очень длинных слов).

источник

15:28пожаловаться #14

Anatoly Tomilov in pro.algorithms

но не вблизи односекундных времён

источник

15:29пожаловаться #15

Evgenii Zheltonozhsk... in pro.algorithms

В чем подвох?

источник

15:29пожаловаться #16

Constantine Drozdov in pro.algorithms

не 2 * log N
(1 + o(1))