Вам известны какие-нибудь библиотеки для описания регулярных выражений, описывающих сиволы, а не их значения? Или хотя бы такие библиотеки регулярных выражений, в которых можно задавать свои наборы значений.
Например я хочу детектить мат и добавляю в фильтр слово "пидарас", любой сможет обойти этот фильтр заменив русские буквы на те же знаки закодированные другим языком, например английским. Например заменят буквы а
и с
. Я бы хотел составить регулярку, которая будет матчить не код символов, а их представление. Не обязательно на js, можно джаву, питон или пыху, сишку