Телеграмм чат группы proalgorithms страница 3935

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

pro.algorithms

1891 membersпожаловаться на группу

2021 April 18

AT

Anatoly Tomilov in pro.algorithms

а, я опять неточен

источник

14:32пожаловаться #1

AT

Anatoly Tomilov in pro.algorithms

посчитать слова — это значит вывести пары — "слово частота" построчно, например

источник

14:32пожаловаться #2

CD

Constantine Drozdov in pro.algorithms

думаешь хешмапа не вытянет 1 ГБ в секунду?

источник

14:33пожаловаться #3

AT

Anatoly Tomilov in pro.algorithms

std::unordered_map вытягивает меньше 100МБ в секунду для слов из человеческих текстов

источник

14:34пожаловаться #4

EZ

Evgenii Zheltonozhsk... in pro.algorithms

а нормальная мапа?)

источник

14:34пожаловаться #5

AT

Anatoly Tomilov in pro.algorithms

так же

источник

14:34пожаловаться #6

CD

Constantine Drozdov in pro.algorithms

оно на порядок медленнее любой адекватной мапы

источник

14:35пожаловаться #7

CD

Constantine Drozdov in pro.algorithms

потому что насилует аллокатор

источник

14:35пожаловаться #8

AT

Anatoly Tomilov in pro.algorithms

для строк std::map может быть эффективнее, т.к. не нужно считать хеш от длинной длинной строки в случае, если префиксы более-менее уникальные

источник

14:36пожаловаться #9

CD

Constantine Drozdov in pro.algorithms

возьми нормальную хешмапу и хеш вида ксор первых 8 байт на последние 8

источник

14:37пожаловаться #10

K

Kotomord_λapki in pro.algorithms

Тогда сортировка и линейный проход будут эффективнее, не?

источник

14:39пожаловаться #11

CD

Constantine Drozdov in pro.algorithms

корзинками по хешу вида ксор первых на последние 8 байт :)

источник

14:43пожаловаться #12

AT

Anatoly Tomilov in pro.algorithms

безумно много коллизий будет

источник

14:43пожаловаться #13

CD

Constantine Drozdov in pro.algorithms

вы пробовали?

источник

14:44пожаловаться #14

AT

Anatoly Tomilov in pro.algorithms

Тогда челлендж: я даю текст 300 с небольшим МБ (дамп всяких книжек на английском) и условие, что словами считаются только непрерывные последовательности из a..z и A..Z(т.е. в предложении state's laws 3 слова). Необходимо посчитать слова и вывести их в lowercase по убыванию частоты и для равной частоты — в лексикографическом порядке. Кто быстрее 1 секунды сделает (на чтение с диска и ввод у меня 270 мс уходит, пусть это будет неизбежный оверхед, вряд ли он вообще будет различаться в решениях)? В тексте слова не длиннее 128 байт. 1 поток.
Текст https://disk.yandex.ru/d/mOY5CrveIAOtnQ
https://disk.yandex.ru/d/p3W1pGZwj95PAQ это референсный вывод для LF окончаний строк
md5sum
850944413ba9fd1dbf2b9694abaa930d *lf.txt
d1362c6c9de664c34c3066ec1d01078f *crlf.txt

Яндекс.Диск

Посмотреть и скачать с Яндекс.Диска

источник

14:44пожаловаться #15

AT

Anatoly Tomilov in pro.algorithms

угу

источник

14:44пожаловаться #16

K

Kotomord_λapki in pro.algorithms

Возможно, и так

источник

14:44пожаловаться #17

CD

Constantine Drozdov in pro.algorithms

ну сдвиньте на 4 там если английский текст в ASCII

источник

14:44пожаловаться #18

CD

Constantine Drozdov in pro.algorithms

суффикс

источник

14:44пожаловаться #19

K

Kotomord_λapki in pro.algorithms

Язык?

источник

14:44пожаловаться #20