Size: a a a

2020 October 07

М

Михаил Власов... in Oracle RU
Регулярки.
источник

М

Михаил Власов... in Oracle RU
Но если адрес не структурирован (типа фиас или кладр и тд) - то это боль.
источник

R

RAEman in Oracle RU
Михаил Власов
Но если адрес не структурирован (типа фиас или кладр и тд) - то это боль.
Адрес редко бывает структурирован. Всегда будут записи о. ****, обл. *, область * и не обязательно что в правильном порядке....
источник

SS

Simon Schwarz in Oracle RU
Makhmut
Всем привет !
Такой вопрос,
Есть адрес клиента
который записан в одну строку , и если город миллионник область не будет записана.
Как можно разделить адреса ?
Так если

Казахстан,северо-Казахстанская обл,Петропавловск г.а. Р-н , г. Петропавловск , ул Пушкина , д. 53 , кв. 117
Казахстан , Г Алматы , Медеуский р-н , ул Достык , д.12 , кв. 1

Делил между запятыми но записи не в идеальном виде , и в один столбец падает и обл и город и район , смотря как менеджер заполнил

Как можно выбрать по кл словам , так если ключевое слово обл. То взять слово между запятыми
Разбираете налету в sql? Или уже в plsql контексте?
источник

M

Makhmut in Oracle RU
пока просто скл , все в ужасном виде
источник

АЛ

Аггей Лоскутников... in Oracle RU
RAEman
Адрес редко бывает структурирован. Всегда будут записи о. ****, обл. *, область * и не обязательно что в правильном порядке....
Да с фиас вообще не проблема ) нужно хранить 2 uuid и все )
источник

R

RAEman in Oracle RU
Аггей Лоскутников
Да с фиас вообще не проблема ) нужно хранить 2 uuid и все )
А с историческими данными что делать?
источник

ДЛ

Дмитрий Лукьянов... in Oracle RU
Makhmut
Всем привет !
Такой вопрос,
Есть адрес клиента
который записан в одну строку , и если город миллионник область не будет записана.
Как можно разделить адреса ?
Так если

Казахстан,северо-Казахстанская обл,Петропавловск г.а. Р-н , г. Петропавловск , ул Пушкина , д. 53 , кв. 117
Казахстан , Г Алматы , Медеуский р-н , ул Достык , д.12 , кв. 1

Делил между запятыми но записи не в идеальном виде , и в один столбец падает и обл и город и район , смотря как менеджер заполнил

Как можно выбрать по кл словам , так если ключевое слово обл. То взять слово между запятыми
Это стандартная задача. И она вызывает головную боль у всех, т.к. адреса могут писаться как угодно. Тут либо писать велосипед, либо использовать готовые API вроде https://dadata.ru/

Они на основе алгоритмов машинного обучения разбирают адрес, сопоставляют с реестром реальных адресов, и выдают тебе уже разобранный результат. До 1000 запросов в день бесплатно. Выше - платно.
Можно купить коробочное решение, и развернуть у себя в ЦОД. Дорого, но может быть выгодно для ваших задач, например, если запросов реально много.
источник

АЛ

Аггей Лоскутников... in Oracle RU
Искать в фиас и поставлять  aoid, aoguid
источник

R

RAEman in Oracle RU
Дмитрий Лукьянов
Это стандартная задача. И она вызывает головную боль у всех, т.к. адреса могут писаться как угодно. Тут либо писать велосипед, либо использовать готовые API вроде https://dadata.ru/

Они на основе алгоритмов машинного обучения разбирают адрес, сопоставляют с реестром реальных адресов, и выдают тебе уже разобранный результат. До 1000 запросов в день бесплатно. Выше - платно.
Можно купить коробочное решение, и развернуть у себя в ЦОД. Дорого, но может быть выгодно для ваших задач, например, если запросов реально много.
Звучит как реклама😅 "на основе машинного обучения..."
источник

АЛ

Аггей Лоскутников... in Oracle RU
Вообщем у нас на этот случай fts прикручен на фиас с префиксным и постфиксным поиском. По идее если отбросить все вот эти "обл." должен находить довольно точно
источник

M

Makhmut in Oracle RU
Дмитрий Лукьянов
Это стандартная задача. И она вызывает головную боль у всех, т.к. адреса могут писаться как угодно. Тут либо писать велосипед, либо использовать готовые API вроде https://dadata.ru/

Они на основе алгоритмов машинного обучения разбирают адрес, сопоставляют с реестром реальных адресов, и выдают тебе уже разобранный результат. До 1000 запросов в день бесплатно. Выше - платно.
Можно купить коробочное решение, и развернуть у себя в ЦОД. Дорого, но может быть выгодно для ваших задач, например, если запросов реально много.
тут кажется безопасники не разрешат (
источник

АЛ

Аггей Лоскутников... in Oracle RU
Дмитрий Лукьянов
Это стандартная задача. И она вызывает головную боль у всех, т.к. адреса могут писаться как угодно. Тут либо писать велосипед, либо использовать готовые API вроде https://dadata.ru/

Они на основе алгоритмов машинного обучения разбирают адрес, сопоставляют с реестром реальных адресов, и выдают тебе уже разобранный результат. До 1000 запросов в день бесплатно. Выше - платно.
Можно купить коробочное решение, и развернуть у себя в ЦОД. Дорого, но может быть выгодно для ваших задач, например, если запросов реально много.
Вопрос доверия результату. Ошибки будут у всех. Нужно просто оценить какой порог приемлем
источник

ДЛ

Дмитрий Лукьянов... in Oracle RU
RAEman
Звучит как реклама😅 "на основе машинного обучения..."
Ну, я не аффилирован с этой компанией, если что... =)
Сам пользовался в учебном проекте этим API. Ну, и у нас куплена коробка под отдельный проект.
источник

ДЛ

Дмитрий Лукьянов... in Oracle RU
Аггей Лоскутников
Вопрос доверия результату. Ошибки будут у всех. Нужно просто оценить какой порог приемлем
Если ты сможешь написать лучше, вопросов нет. Но я сильно сомневаюсь, что ты осилишь...
У них тупо нет конкурентов на рынке. Можешь запилить аналог - обогатишься. Пока никто не запилил...
источник

ДЛ

Дмитрий Лукьянов... in Oracle RU
Makhmut
тут кажется безопасники не разрешат (
Я же написал выше. Можете купить коробку, и развернуть в локальном ЦОД. Наружу ничего ходить не будет. Безопасники будут довольны.
источник

АЛ

Аггей Лоскутников... in Oracle RU
Смотри. Тут уж не аналог, но рабочий вариант fias.egisz.rosminzdrav.ru
источник

АЛ

Аггей Лоскутников... in Oracle RU
Без нейронок. Но возможно и простой fts будет приемлем
источник

ДЛ

Дмитрий Лукьянов... in Oracle RU
Аггей Лоскутников
Смотри. Тут уж не аналог, но рабочий вариант fias.egisz.rosminzdrav.ru
Ты можешь там просто строку передавать с адресом, написанном в любом порядке, с сокращениями, с синтаксическими ошибками иногда?
источник

SS

Simon Schwarz in Oracle RU
источник