Size: a a a

2021 October 10

E

Evgeniya in Qlik BI chat
Ну там не так все плохо, но может быть полное название, может сокращенное. Может еще в скобках что-то дописать
источник

ZS

Zhenya Skrebanov in Qlik BI chat
Согласен, поэтому эта задача хоть и может быть решена кликом, но все же не совсем полноценно только им, если там сложный набор поиска и алгоритмов нужно накладывать, то придётся в другие решения смотреть, которые созданы под задачи data quality
источник

MD

Maxim Deviatov in Qlik BI chat
Практически решал эту задачу. Левенштайн хорош, но на практике "ни о чём", тк у вас нет эталона (правильного ответа).
У меня не было времени искать идеальный ответ, поэтому был задействован сервис Дадата (гуглите). Его плюс в том, что любой адрес он приводит к эталонному (правильному) и дает оценку достоверности этого приведения.
На клике это не сделать, мы использовали питон на этапе очистки данных.
источник

E

Evgeniya in Qlik BI chat
я поняла, спасибо.Значит в моем случае меппинг сейчас.
источник

E

Evgeniya in Qlik BI chat
эта функция не везде помогает
источник

E

Evgeniya in Qlik BI chat
LevenshteinDist('Korea, Republic of (South Korea)','Korea, Dem. Rep.')
источник

E

Evgeniya in Qlik BI chat
LevenshteinDist('Korea, Republic of (South Korea)','Korea,  Rep.')
источник

E

Evgeniya in Qlik BI chat
выдаст одинаково
источник

E

Evgeniya in Qlik BI chat
хотя в первом случае южная корея,а во втором северная
источник

MD

Maxim Deviatov in Qlik BI chat
угу. А еще какое из этих двух написаний верное?
источник

E

Evgeniya in Qlik BI chat
Korea, Democratic People's Rep. (North Korea)
Korea, Republic of (South Korea)  - это данные справочника, а в данных вот так:
источник

E

Evgeniya in Qlik BI chat
Korea, Dem. Rep.
Korea, Rep.
источник

ZS

Zhenya Skrebanov in Qlik BI chat
У вас 1 задача исправить ошибки написания, вторая привести записи в единый вид
источник

ZS

Zhenya Skrebanov in Qlik BI chat
В данном случае не важно, какая Корея, важно чтобы Карея, Корея, Кереея и прочее были указаны как Корея
источник

ZS

Zhenya Skrebanov in Qlik BI chat
А далее можно просто мапить
источник

ZS

Zhenya Skrebanov in Qlik BI chat
10 уровненный аплаймап в аплаймапе :)
источник

E

Evgeniya in Qlik BI chat
Да понятное дело,что можно просто мапить, хочется без этого обойтись. Без мапинга
источник

ZS

Zhenya Skrebanov in Qlik BI chat
Ну так решения все равно не простые в стиле тык и тык и готово, можно использовать набор index, subfield, len, if, substrincount и прочие текстовые функции в различных комбинациях, правил так однажды адреса введённые руками разными способами. Либо подключать всякие питоны и подобное и использовать DQ алгоритмы, либо, как писал Максим, использовать сторонний сервис для этого созданный.
источник

ZS

Zhenya Skrebanov in Qlik BI chat
А ещё, весьма занятный вариант и довольно хардкорный, править все руками в экселе:)
источник

E

Evgeniya in Qlik BI chat
😄👍
источник