Телеграмм чат группы natural_language

У pymorphy точность низкая, хотя смотря для какой задачи. Но скорость высокая. А у того решения точность немного выше, скорость намного ниже. Rnnmorph/Mara/spacy-ru -- промежуточное положение, первые два на rnn, последнее на cnn.

источник

08:28пожаловаться #8

Munawwar in Natural Language Processing

Any one have text summarization code

источник

10:29пожаловаться #9

Vic in Natural Language Processing

Munawwar

Any one have text summarization code

I, pm if needed

источник

10:52пожаловаться #10

Alex Konst in Natural Language Processing

Есть те, кто морочился с back-translation-augmentation? Какие есть наиболее безболезненные решения для русскоязычных данных?

источник

19:09пожаловаться #11

АК

Александр Крючков in Natural Language Processing

Кто-нибудь знает какое-нибудь решение для тестирования вопросно-ответного поиска в тексте на русском языке?
Подойдёт любые тексты. Мне интересно насколько хорошо/плохо работает в итоге. Кое-какие знания в обработке NLP есть, но давно не следил за достижениями в этой области. Слышал, что BERT везде используется. Увидел пример в блоге Tensorflow. Интересует такой же аналог для русского.
https://blog.tensorflow.org/2020/03/exploring-helpful-uses-for-bert-in-your-browser-tensorflow-js.html

blog.tensorflow.org

Exploring helpful uses for BERT in your browser with Tensorflow.js

There’s a lot of exciting research happening now exploring helpful uses of BERT for language. We wondered: what if we made BERT even more accessible, right in your web browser? What possible uses might this enable?

It’s easy to ask Google a question like “How tall is the statue of liberty?” and get the answer (305 feet) from the web. However, there's no easy way to ask natural language questions of specific content - like a news article, research paper, or blog post. You can try using the find-in-page search feature of your browser (CTRL + F) but that relies on direct word matching. Wouldn’t it be easier to type a question, instead of a word to find, and have the page highlight the answer for you?

источник

23:32пожаловаться #12

2020 April 21

Dmitry Legchikov in Natural Language Processing

У дип павлова вроде есть предобученный берт на датасете сбера

источник

00:04пожаловаться #13

Dmitry Legchikov in Natural Language Processing

SberQA кажется датасет

источник

00:05пожаловаться #14

АК

Александр Крючков in Natural Language Processing

Посмотрю тогда.

источник

12:08пожаловаться #15

Aleksandr Mester in Natural Language Processing

Друзья, а noun_chunks извлучение для русского можете что подсказать? Насколько я понял у spacy для русского нет этой фичи пока, и стенфорд модели для русского через нлтк тоже нет.

источник

19:18пожаловаться #16

Vadim Gudkov in Natural Language Processing

dependancy parsing с помощью UDPipe, обученном на syntagrus, потом dfs для всех существительных.
либо регулярные выражения

источник

23:13пожаловаться #17

Vadim Gudkov in Natural Language Processing

со spacy для русского языка можно использовать вот эту библиотеку
https://github.com/TakeLab/spacy-udpipe
ей можно подавать кастомные UDPipe модели ( в том числе русские). Интерфейс будет, как у обычного spacy

источник

23:16пожаловаться #18

Vadim Gudkov in Natural Language Processing

модели можно брать вот тут https://ufal.mff.cuni.cz/udpipe/models

источник

23:17пожаловаться #19

Vadim Gudkov in Natural Language Processing

схожую задачу решал для извлечения prepositional_phrases. Вот решение https://github.com/merionum/pphrase, мож пригодится для reference

источник

23:18пожаловаться #20