Size: a a a

2021 December 01

PZ

Pavel Zlatovratskii in Distributed
Если я правильно нагуглил - то и на русском тоже. На всех языках. Поэтому эффективность непосредственно русского так себе
источник

PZ

Pavel Zlatovratskii in Distributed
источник

YB

Yanis Benson in Distributed
Кстати, даже не учитывая тяжеловесности бротли
источник

YB

Yanis Benson in Distributed
Весь этот чат оправдал скачивание словаря бротли всего 17 раз за свое существование.
источник

YB

Yanis Benson in Distributed
Не говоря уж о скорости сжатия.
источник

YB

Yanis Benson in Distributed
Подразумевается сам бинарник
источник

YB

Yanis Benson in Distributed
По сравнению с дефлейтом5
источник

PZ

Pavel Zlatovratskii in Distributed
Шо за дефлейт5 ?
источник

YB

Yanis Benson in Distributed
Ну дефлейт на уровне 5
источник

YB

Yanis Benson in Distributed
Это то, что внутри гзипа
источник

YB

Yanis Benson in Distributed
Ну гзип целиком нам тут явно не нужен
источник

PZ

Pavel Zlatovratskii in Distributed
Мнэээ... какие у тебя данные получились???
У меня получилось что 124000 из 172000 сжались лучше  всего бротли и только 6000 дефлейтом...
источник

АЖ

Алексей Жалнин... in Distributed
русский там... хм
cat ./dictionary-sorted.txt |grep "[А-Яа-я]" |wc -l
303
источник

YB

Yanis Benson in Distributed
Я не считал разбиения пока, чисто общие и кванты
источник

АЖ

Алексей Жалнин... in Distributed
словарь ты качаешь по вайфаю, а сообщения шлёшь по лоре
источник

YB

Yanis Benson in Distributed
Да, кстати, с русским там смешно
источник

YB

Yanis Benson in Distributed
Абстракча та еще
источник

YB

Yanis Benson in Distributed
Если он действительно просто словарь, то видимо для русского не особо подходит алгоритм
источник

YB

Yanis Benson in Distributed
Из-за редких длинных частых слов
источник

БГ

Бензофуран Гетероцик... in Distributed
А может стоит взять распространённость языков и распространённость символов в этих языках и сделать универсальную оптимальную кодировку?)
источник