Но вообще, даже со словарями для таких коротких сообщений выходят малоприменимы стандартные алгоритмы. Эффективность по мелочи, нормальная начинается от 512 байт
сама по себе частотность символов больше используется в определении языка или типа текста.. для сжатия по ней определяется какие лексемы тащить в словарь... ну и чототам ещё
Ну, кстати, для интересующихся, в бородатые годы я писал утф-таргетированное сжатие какое-то прагматичное, и какой-то базовый метод вида поддерживать 2 последних использованных подтаблицы(даже без эскейпов) давал мне результаты, сравнимые со всем этим для текстов.
ну вот я предполагал тривиальное: сжат/несжат. Потому что часто оно просто не сжимается даже бротли.
При этом это перестаёт быть актуальным для шифрования, где всё равно надо бы перемешать во-первых и надо иметь некоторый минимальный размер во-вторых (а минимальный размер приводит к тому, что микросжатия не актуальны, а большой блок почти всегда сжимается)