Всем, привет!
Возник вопрос отобрать уникальные имена в списке с похожими наименованиями.
Есть следующая таблица:
http://sqlfiddle.com/#!4/b8792/7 где 3 раза встречается имя polina с разными буквами и 1 раз имя lena.
Я делаю cross join и рассчитываю схожесть текстов. Чем больше similarity тем сильнее тексты похожи друг на друга.
И рассчитываю схожесть текстов. Чем больше similarity тем сильнее тексты похожи друг на друга.
Вопрос: как из итоговой таблицы получить только уникальные имена: polina и lena?
Вместо polina может быть любое другое (pavlina или palina).