)) чисто теоретически сообщения до 140 символов можно хранить в utf-c и как-нибудь их помечать, а если сообщение больше 140 символов, то уже хранить в utf-8 или других альтернативах
я всё жду, пока тут кто-нить потестит русский словарь на zstd (у самого лапки и вообще это с дивана вставать, корпус сообщений какой-нить конфы искать....)
Индекс нужен для нормализации, я считаю. Типа чтобы леммы искать, вот это всё.... то есть вопрос скорее оптимизации процесса поиска, чем оптимизации хранения.