Всем привет, сталкивался ли кто-то с такой задачей и чем это решать?
Предыстория/общая задача:
Необходимо сопоставить названия торговых марок/франшиз/компаний (объектов) с учетом транслитераций и переводов из нескольких источников для того чтобы собрать обобщенную информацию об этих объектах в новую витрину.
Витрины источников находятся в hive таблицах (orc), витрина результ тоже по итогу должна выгружаться в hive.
Проблема:
Непонятно чем и как делать сопоставление названий с учетом перевода, есть какие-нибудь идеи или советы на этот счет?
Если с транслитом нет проблем, то может это просто должен быть обратный транслит? Вряд ли кто-то будет подбирать русское слово для Unilever, а транслитерация активно используется и всем понятна