Size: a a a

2021 December 01

АЖ

Алексей Жалнин... in Distributed
графы это почти как коммунизм
такая же великолепная штука которую всем что-то мешает запилить
источник

PZ

Pavel Zlatovratskii in Distributed
Данные все в протоколе есть.

Сядь и напиши клиент, чо ты...
источник

БГ

Бензофуран Гетероцик... in Distributed
Например то что удобоваримо отображать невероятно сложно
источник

YB

Yanis Benson in Distributed
Но вообще, даже со словарями для таких коротких сообщений выходят малоприменимы стандартные алгоритмы. Эффективность по мелочи, нормальная начинается от 512 байт
источник

YB

Yanis Benson in Distributed
Нужен специализированный алгоритм.
источник

АЖ

Алексей Жалнин... in Distributed
сама по себе частотность символов больше используется в определении языка или типа текста..
для сжатия по ней определяется какие лексемы тащить в словарь... ну и чототам ещё
источник

YB

Yanis Benson in Distributed
И, к слову, тот алгоритм, который я ещё не компилял, клялся-божился, что может даже три байта сжать часто.
источник

АЖ

Алексей Жалнин... in Distributed
результаты тестов в студию
источник

АЖ

Алексей Жалнин... in Distributed
клиенты гита справляются нормально
источник

YB

Yanis Benson in Distributed
Все тащить день, если кратко, эффективность около 2 для бротли, около 1.5 для лз4/снэппи, около 1.75 для дефлейт5.
источник

БГ

Бензофуран Гетероцик... in Distributed
Частоты символов для оптимального кодирования
Частоты пар-троек-слогов - для кодирования уже их
источник

YB

Yanis Benson in Distributed
Ну можно ещё байт выборки сжатия внешний добавить, конечно
источник

АЖ

Алексей Жалнин... in Distributed
"кодирование" == словарь
источник

YB

Yanis Benson in Distributed
Нет
источник

YB

Yanis Benson in Distributed
Возвратное кодирование(~= словарь) это не все виды кодирования при сжатии.
источник

YB

Yanis Benson in Distributed
Ну, кстати, для интересующихся, в бородатые годы я писал утф-таргетированное сжатие какое-то прагматичное, и какой-то базовый метод вида поддерживать 2 последних использованных подтаблицы(даже без эскейпов) давал мне результаты, сравнимые со всем этим для текстов.
источник

YB

Yanis Benson in Distributed
Надо бы сесть да поковыряться
источник

YB

Yanis Benson in Distributed
Примерно уверен, что можно за пару вечеров набросать лучше, чем все вышеописанное для нормальных случаев без частностей по языку.
источник

АЖ

Алексей Жалнин... in Distributed
ага, конечно
пара вечеров
в сжатии, ага, лучше
источник

PZ

Pavel Zlatovratskii in Distributed
ну вот я предполагал тривиальное: сжат/несжат. Потому что часто оно просто не сжимается даже бротли.

При этом это перестаёт быть актуальным для шифрования, где всё равно надо бы перемешать во-первых и надо иметь некоторый минимальный размер во-вторых (а минимальный размер приводит к тому, что микросжатия не актуальны, а большой блок почти всегда сжимается)
источник