Size: a a a

Natural Language Processing

2019 November 18

V

Vlad in Natural Language Processing
Тоже видел, там получается надо будет скрипт делать, который из него данные сначала извлечёт, точнее весь словарь соберёт

Словаря в виде файла я там не нашел
источник

VI

Vitaly Ivanin in Natural Language Processing
Ещё проблема в том, что там частоты не учитываются
источник

SZ

Sergey Zakharov in Natural Language Processing
Можно юзать его как сервис и кэшировать по идее. Там больше вопрос, какую именно расшифровку использовать, если их несколько.
источник

VI

Vitaly Ivanin in Natural Language Processing
там у чс есть много расшифровок, и черезвычайная ситуация не на первом месте
источник

SZ

Sergey Zakharov in Natural Language Processing
возможно, придётся заморочиться с определением контекста и прочее такое
источник

SZ

Sergey Zakharov in Natural Language Processing
По запросу "и т.д." выдаёт целую страницу всякой лабуды, но и "и т.д." на ней тоже есть
источник

V

Vlad in Natural Language Processing
Вот этот словарь в таком контексте смотрится лучше, хоть он и сильно меньше

Там максимум 2-3 значения для каждой расшифровки, руками за пару часов думаю можно будет отобрать то, что больше подходит под мою ПО
источник

S

Sergey in Natural Language Processing
Vitaly Ivanin
Есть задача по логам чата выявить пары сообщений, потенциально полезные для обучения чат-бота.
Типо вопросы-ответы, реакции на утверждения ("не забудь купить молоко" - "хорошо, не забуду", "они молодцы" - "да, я за них болел") и возможно что-то ещё. Как к такой задаче стоит подойти?
Помню была статья, где юзался датасет для классифицирования двух суждений, как они с друг другом соотносятся, но там был берт и это как -то жирно
а найдется ссылка на эту статью?
источник

VI

Vitaly Ivanin in Natural Language Processing
Sergey
а найдется ссылка на эту статью?
нет, сорян. ну там не очень интересно на самом деле, просто взяли датасет пар и пытались предсказывать, является ли правая чать объяснением  левой, или они нейтральны (но про одно и то же)
источник

S

Sergey in Natural Language Processing
понял - я кажется даже читал  эту статью
источник

Y

Yurii in Natural Language Processing
Как сделать чтобы при pos-tagging spacy ru адекватно реагировала например на "когда-нибудь", а не разбивала бы на 3 токена?
@yuri_baburov
источник

YB

Yuri Baburov in Natural Language Processing
Yurii
кванторы это конечно хорошо, но скажите лучше где взять все варианты частей речи для слов в английском языке
Есть Wiktionary, может даже кто-то его для вас уже распарсил
источник

YB

Yuri Baburov in Natural Language Processing
Yurii
Как сделать чтобы при pos-tagging spacy ru адекватно реагировала например на "когда-нибудь", а не разбивала бы на 3 токена?
@yuri_baburov
Надо сделать там в lemmatizer правило для объединения токенов по дефису. Могу завтра посмотреть подробнее и пример такого правила написать
источник

NM

Námo Morimando in Natural Language Processing
Yuri Baburov
Есть Wiktionary, может даже кто-то его для вас уже распарсил
Официальные выгрузки можно просто скачать
источник

Y

Yurii in Natural Language Processing
Yuri Baburov
Надо сделать там в lemmatizer правило для объединения токенов по дефису. Могу завтра посмотреть подробнее и пример такого правила написать
Спасибо, было бы неплохо.
источник

YB

Yuri Baburov in Natural Language Processing
Námo Morimando
Официальные выгрузки можно просто скачать
Да, но там эта информация не в инфобоксах, нужно парсить именно HTML для извлечения нужной информации. Лучше даже не Вики-шаблоны из выгрузки, а именно html.
источник

YB

Yuri Baburov in Natural Language Processing
Ну или можно взять любой словарь англ языка
источник

AP

Alexey Potapov in Natural Language Processing
Друзья, знакомый разрабатывает онлайн редактор семантических графов biomindmap.com, подскажите пожалуйста какие продукты с ИИ можно применять для создания и улучшения подобных семантических графов ? Для NLP научных статей в графы, привязки весов/метрик итп ?
источник
2019 November 20

hj

harin joshi in Natural Language Processing
источник
2019 November 21

D

Dmitry in Natural Language Processing
Может кто-нибудь подсказать, где я могу почитать про методы, способы визуализации данных после извлечения из текста ключевой информации?
источник