Size: a a a

Natural Language Processing

2019 December 15

ПП

Павел Приказчиков in Natural Language Processing
Приветствую, а вы используете flair для русского языка?
источник

AD

Alfredo Diezo in Natural Language Processing
Нет, для английского
источник

DP

Dmitriy Pankov in Natural Language Processing
Alfredo Diezo
Всем привет
Столкнулся с такой задачей. Имеется некоторое предложение. За ним следует другое, и нужно определить: является следующее просто пересказом предыдущего, либо же это "продолжение истории"
Как понимаю, первое — это задача paraphrase identification. А второе? И чем лучше решать? Из того, что здесь видел — flair и LASER
Привет. Второе пересекается с задачей поиска анафорических связей.
источник

AD

Alfredo Diezo in Natural Language Processing
Dmitriy Pankov
Привет. Второе пересекается с задачей поиска анафорических связей.
Спасибо за наводку!
А в какой библиотеке лучше искать реализации под это?
источник

DP

Dmitriy Pankov in Natural Language Processing
Не знаю готовой реализации, но помнится были статьи на Диалоге по этой тематике
источник

A

Aragaer in Natural Language Processing
Павел Приказчиков
Приветствую, а вы используете flair для русского языка?
да
источник

AC

Alexander C in Natural Language Processing
источник

AC

Alexander C in Natural Language Processing
може кому полезно
источник

ЮГ

Юлия Галиева in Natural Language Processing
Всем привет! Ребята, пытаюсь спарсить текст между тегами (к сожалению, надо это сделать с помощью yargy).

Может был у кого такой опыт? Пока только токенайзером удалось, но не нравится решение, тк это в регулярки упирается
источник
2019 December 16

M

Manoj in Natural Language Processing
What are some advanced NLP courses? Be it anywhere kaggle, github, edx, coursera.
источник

ПП

Павел Приказчиков in Natural Language Processing
Официально же не поддерживается? Подскажите как используете?
источник

A

Aragaer in Natural Language Processing
там есть туториал для non-latin символов
источник

ПП

Павел Приказчиков in Natural Language Processing
Понял, спасибо
источник

D(

David (ddale) Dale in Natural Language Processing
Друзья, а кто умеет эффективно скукоживать fasttext? Не классификатор, а именно кусок, который эмбеддинги для OOV слов составляет.
Пока что нашёл статьюшку Андрея Васнецова (https://medium.com/@vasnetsov93/shrinking-fasttext-embeddings-so-that-it-fits-google-colab-cd59ab75959e) и буду её пробовать, но может у кого-нибудь ещё опыт есть такой)
источник

AK

Alexander Kukushkin in Natural Language Processing
Есть опыт сжатия обычных эмбедингов https://github.com/natasha/navec . Там используется квантизация, с fasttext можно так же но логика сложнее
источник

D(

David (ddale) Dale in Natural Language Processing
Alexander Kukushkin
Есть опыт сжатия обычных эмбедингов https://github.com/natasha/navec . Там используется квантизация, с fasttext можно так же но логика сложнее
Ага, navec я тоже нашёл и успел полюбить :)
Может, попробую сначала попрюнить fasttext методом Андрея, а потом ещё и квантизировать - твоим)
источник

RV

Rinat Valiullov in Natural Language Processing
источник

В

Владислав in Natural Language Processing
Добрый день. Есть ли на премете датасеты для сентиментального анализа на русском для деловых переписок, рабочих обсуждений, в которых негатив выражается не в виде явных оскорблений и "постановках диагнозов", а в завуалированном виде?
источник

В

Владислав in Natural Language Processing
Или что то близкое по тексту
источник

V

Vlad in Natural Language Processing
Всем привет. Кто-нибудь решал тут задачу расстановки ударений в русских ФИО? Пробовал russian_g2p, почти всегда на первый слог ставит. Пока никакого решения, кроме как делать словарь ударений для ФИО не вижу...
источник