Size: a a a

Natural Language Processing

2019 October 28

V

Vlad in Natural Language Processing
Кто-нибудь может подсказать стеммер для украинского языка? Внезапно оказалось, что PyStemmer его не поддерживает
источник

D

Daria in Natural Language Processing
Vlad
Кто-нибудь может подсказать стеммер для украинского языка? Внезапно оказалось, что PyStemmer его не поддерживает
Вроде pymorphy умеет в украинский
источник

YP

Yaroslav Pikaliov in Natural Language Processing
Если под стеммером он имеет ввиду оставить лишь основу - то нет
источник

V

Vlad in Natural Language Processing
Именно, оставить основу слова

Pymorphy умеет только лемматизировать
источник

V

Vlad in Natural Language Processing
Если вдруг кому-то надо, то вроде что-то нашёл https://github.com/Amice13/ukr_stemmer
источник
2019 October 29

V

Vlad in Natural Language Processing
Запилил под этот украинский стеммер небольшую обёртку для установки через pip, если кому-то когда-то понадобится: https://github.com/Desklop/Uk_Stemmer
источник

SZ

Sergey Zakharov in Natural Language Processing
источник

SB

Sergey Bilenko in Natural Language Processing
Парни, что бы это на практике значило, где-то появился открытый репозиторий с BERT? Странная какая-то статья - ссылки на первоисточник нет :(
источник

SB

Sergey Bilenko in Natural Language Processing
источник

SB

Sergey Bilenko in Natural Language Processing
источник

GG

Gleb Glushkov in Natural Language Processing
Sergey Bilenko
Парни, что бы это на практике значило, где-то появился открытый репозиторий с BERT? Странная какая-то статья - ссылки на первоисточник нет :(
источник

SB

Sergey Bilenko in Natural Language Processing
Спасибо, тоже нашел. Но не похоже, чтобы этот репозиторий недавно обновлялся. Я думал где-то ещё есть, где новый релиз выкатили
источник

AK

Anton Kiselëv in Natural Language Processing
Sergey Bilenko
Спасибо, тоже нашел. Но не похоже, чтобы этот репозиторий недавно обновлялся. Я думал где-то ещё есть, где новый релиз выкатили
Они текстовые фичи из BERT теперь стали использовать в поиске, об этом анонс
источник

CT

Cookie Thief in Natural Language Processing
Ну скорее всего они как то берта докрутили, но сомневаюсь, что они это выложат)
источник

NS

Nikolay Shmyrev in Natural Language Processing
Sergey Bilenko
Парни, что бы это на практике значило, где-то появился открытый репозиторий с BERT? Странная какая-то статья - ссылки на первоисточник нет :(
источник
2019 October 30

АЗ

Андрей Заспа in Natural Language Processing
Почему Natasha не распознает такие адреса: Свердловская обл., г. Екатеринбург, Барвинка 21и Нижегородская обл, Ардатовский р-н, Ардатов рп, Ленина ул, 14? И как можно это докрутить, чтобы работало распознавание и нормализация адреса?
источник

IN

Ilya Nikitin in Natural Language Processing
Андрей Заспа
Почему Natasha не распознает такие адреса: Свердловская обл., г. Екатеринбург, Барвинка 21и Нижегородская обл, Ардатовский р-н, Ардатов рп, Ленина ул, 14? И как можно это докрутить, чтобы работало распознавание и нормализация адреса?
Видимо, не попадают под прописанные паттерны
источник

IN

Ilya Nikitin in Natural Language Processing
Нашел информацию о похожих случаях
источник

IN

Ilya Nikitin in Natural Language Processing
источник

АЗ

Андрей Заспа in Natural Language Processing
Я переписывал Yargy для распознавания имени организации, просто странно, помещать в пример, что твоя библиотека ничего не нашла. И почему то разработка уже год не ведется, последний коммит в 2018 году
источник