Size: a a a

Natural Language Processing

2020 April 19

DK

Denis Kirjanov in Natural Language Processing
Но там по леммам в общем он тоже всех обогнал вроде
источник

DK

Denis Kirjanov in Natural Language Processing
Хоть и ненамного
источник

NS

Nikolay Shmyrev in Natural Language Processing
Denis Kirjanov
По интегральной, да
Ссылочку-то можно?
источник

FF

Futorio Franklin in Natural Language Processing
источник

V

Vlad in Natural Language Processing
А насколько быстро оно работает? Особенно на фоне какого-нибудь pymorphy2
источник

FF

Futorio Franklin in Natural Language Processing
Vlad
А насколько быстро оно работает? Особенно на фоне какого-нибудь pymorphy2
Там bert и lstm используется, так что не уверен, что очень быстро
источник

FF

Futorio Franklin in Natural Language Processing
Можно замерить, автор оставил ссылку на модель
источник
2020 April 20

YB

Yuri Baburov in Natural Language Processing
Vlad
А насколько быстро оно работает? Особенно на фоне какого-нибудь pymorphy2
У pymorphy точность низкая, хотя смотря для какой задачи. Но скорость высокая. А у того решения точность немного выше, скорость намного ниже. Rnnmorph/Mara/spacy-ru -- промежуточное положение, первые два на rnn, последнее на cnn.
источник

M

Munawwar in Natural Language Processing
Any one have text summarization code
источник

V

Vic in Natural Language Processing
Munawwar
Any one have text summarization code
I, pm if needed
источник

AK

Alex Konst in Natural Language Processing
Есть те, кто морочился с back-translation-augmentation? Какие есть наиболее безболезненные решения для русскоязычных данных?
источник

АК

Александр Крючков in Natural Language Processing
Кто-нибудь знает какое-нибудь решение для тестирования вопросно-ответного поиска в тексте на русском языке?
Подойдёт любые тексты. Мне интересно насколько хорошо/плохо работает в итоге. Кое-какие знания в обработке NLP есть, но давно не следил за достижениями в этой области. Слышал, что BERT везде используется. Увидел пример в блоге Tensorflow. Интересует такой же аналог для русского.
https://blog.tensorflow.org/2020/03/exploring-helpful-uses-for-bert-in-your-browser-tensorflow-js.html
источник
2020 April 21

DL

Dmitry Legchikov in Natural Language Processing
У дип павлова вроде есть предобученный берт на датасете сбера
источник

DL

Dmitry Legchikov in Natural Language Processing
SberQA кажется датасет
источник

АК

Александр Крючков in Natural Language Processing
Посмотрю тогда.
источник

AM

Aleksandr Mester in Natural Language Processing
Друзья, а noun_chunks извлучение для русского можете что подсказать? Насколько я понял у spacy для русского нет этой фичи пока, и стенфорд модели для русского через нлтк тоже нет.
источник

VG

Vadim Gudkov in Natural Language Processing
dependancy parsing с помощью UDPipe, обученном на syntagrus, потом dfs для всех существительных.
либо регулярные выражения
источник

VG

Vadim Gudkov in Natural Language Processing
со spacy для русского языка можно использовать вот эту библиотеку
https://github.com/TakeLab/spacy-udpipe
ей можно подавать кастомные UDPipe модели ( в том числе русские). Интерфейс будет, как у обычного spacy
источник

VG

Vadim Gudkov in Natural Language Processing
модели можно брать вот тут https://ufal.mff.cuni.cz/udpipe/models
источник

VG

Vadim Gudkov in Natural Language Processing
схожую задачу решал для извлечения prepositional_phrases. Вот решение https://github.com/merionum/pphrase, мож пригодится для reference
источник