Size: a a a

Natural Language Processing

2020 February 25

D(

David (ddale) Dale in Natural Language Processing
Vlad
Кстати, точность около 75% на sentiment для русского - нормальное значение или можно получить больше?

Обучал на предложенном выше датасете из набора русских твитов, перед BiLSTM использовал word2vec для получения векторов
Достижимая точность очень зависит от датасета. В общем случает сказать, что 75%  это норм или маловато, нельзя.
источник

DK

Denis Kirjanov in Natural Language Processing
Vlad
Кстати, точность около 75% на sentiment для русского - нормальное значение или можно получить больше?

Обучал на предложенном выше датасете из набора русских твитов, перед BiLSTM использовал word2vec для получения векторов
В среднем по больнице будто норм
источник

V

Vlad in Natural Language Processing
Я на тот момент, это было около года назад, пробовал явно около 10 если не больше разных нейронок и у всех был результат либо хуже, либо такой же, 74-76%
Ну и потом оставил самую быструю и простую из них)
источник

D

Dmitry in Natural Language Processing
Интересно сколько даёт NB на этом датасете после очистки от смайлов
источник

D

Dmitry in Natural Language Processing
Наверное те же 74-75
источник

D(

David (ddale) Dale in Natural Language Processing
Возвращаясь к фасттексту.
Я выложил свой текст про компрессию gensim'овскгого fastText (и код, и пожатые модельки).
Пригодится тем, кто деплоит модели на условном heroku и хочет готовые эмбеддинги, которые помещались бы в маленькую память.
Предлагаю полайкать)
https://habr.com/ru/post/489474/
источник

ck

cnstntn kndrtv in Natural Language Processing
David (ddale) Dale
Возвращаясь к фасттексту.
Я выложил свой текст про компрессию gensim'овскгого fastText (и код, и пожатые модельки).
Пригодится тем, кто деплоит модели на условном heroku и хочет готовые эмбеддинги, которые помещались бы в маленькую память.
Предлагаю полайкать)
https://habr.com/ru/post/489474/
Уже разлетелась. Утром пара человек прислали ссылку на эту статью)
источник

rr

ragib rahi in Natural Language Processing
Could anyone say me in nlp its showing wordfunction is not define
источник

VG

Vadim Gudkov in Natural Language Processing
Коллеги, а для использования предобученной fasttext модели с rusvectores ( none_fasttextcbow ) нужно ли проводить какую либо предобработку? (лемматизация / частеречная разметка)
Или же это актуально только для тех, что помечены? ( upos )
источник

VS

Valera Sarapas in Natural Language Processing
David (ddale) Dale
Возвращаясь к фасттексту.
Я выложил свой текст про компрессию gensim'овскгого fastText (и код, и пожатые модельки).
Пригодится тем, кто деплоит модели на условном heroku и хочет готовые эмбеддинги, которые помещались бы в маленькую память.
Предлагаю полайкать)
https://habr.com/ru/post/489474/
Есть задача улучшить саммаризацию текста. Сейчас все написано на gensim. Может что-то посоветуете?
источник

AB

Arcady Balandin in Natural Language Processing
Какой сейчас лучший dependency parser?
источник

DK

Denis Kirjanov in Natural Language Processing
Arcady Balandin
Какой сейчас лучший dependency parser?
От диппавлова
источник

DK

Denis Kirjanov in Natural Language Processing
Ещё есть удпайп
источник

AB

Arcady Balandin in Natural Language Processing
HanLP по количеству звёзд вроде
источник

AB

Arcady Balandin in Natural Language Processing
источник
2020 February 26

SB

Shubham Bhatt in Natural Language Processing
Anyone ever performed NER on texts which contains Indian names? Please suggest if someone has any idea.
источник

M

Mishanya in Natural Language Processing
Shubham Bhatt
Anyone ever performed NER on texts which contains Indian names? Please suggest if someone has any idea.
You can try multilingual NER from DeepPavlov https://demo.deeppavlov.ai/#/mu/ner
источник

T

Tari in Natural Language Processing
Всем привет!
Я хочу собрать небольшую статистику по использованию библиотеки DeepPavlov в nlp
Пожалуйста, щёлкните на опрос,если пользуетесь!
источник

T

Tari in Natural Language Processing
источник

IK

Irina Krotova in Natural Language Processing
Мне кажется, тут очень не хватает а) многовариантного опроса б) пустого поля
источник