Size: a a a

Natural Language Processing

2020 June 04

AK

Alexander Kukushkin in Natural Language Processing
Denis Kirjanov
а зачем тогда Наташу брать?) солидный проигрыш диппавлову, и по сути ноздря в ноздрю с удпайпом в зависимости от сегмента
Slovnet Syntax оптимизирован для новостей. Имеет смысл если этот домен. Плюс высокая скорость и поддержка Pypy.
источник

DK

Denis Kirjanov in Natural Language Processing
скорость удпайпа только в вашей табличке вызывает вопросы, у меня совсем другие цифры получались, интересно
источник

DK

Denis Kirjanov in Natural Language Processing
у меня получалось порядка 300-350 в секунду
источник

AK

Alexander Kukushkin in Natural Language Processing
Там удпайп поднимался как веб-сервис. Может быть из-за этого. Расходы на сериализацию и всё такое. Впрочем slovnet тоже как веб-сервис.
источник

AK

Alexander Kukushkin in Natural Language Processing
У удпайп нет батч-режима?
источник

DK

Denis Kirjanov in Natural Language Processing
есть, вроде
я дергал питонской обвязкой, она у меня в продакшне крутится, там на сингл-моуд эти 3 мс
источник

DK

Denis Kirjanov in Natural Language Processing
правда я дергаю с предобработанной токенизацией и морфологией, это чисто время парсера
но не думаю все равно, что там просадка x7 из-за лишних модулей, локально работает довольно быстро и целым пайплайном
источник

AK

Alexander Kukushkin in Natural Language Processing
Ещё может быть что у вас просто проц лучше. Там используется старый i5
источник

DK

Denis Kirjanov in Natural Language Processing
Alexander Kukushkin
Ещё может быть что у вас просто проц лучше. Там используется старый i5
я гонял на аймаке кажется в свое время, это правда
для сравнения дельты, если что, я еще айпавлова там же гонял, но на цпу -- можно просто посмотреть, какая дельта получится между удпайпом и павловым на цпу
источник
2020 June 05

V

Victoria in Natural Language Processing
Добрый день
Можно такой нубский вопрос, разметка текстов - это annotation или как-то еще бывает? Marking или markup может быть?
источник

DP

Dmitriy Pankov in Natural Language Processing
Кажется, что наиболее общее слово labeling, но может варьироваться от конкретной задачи (разметка классов, выделение сущностей, аннотирования)
источник

NS

Nikolay Shmyrev in Natural Language Processing
Открыли регистрацию на Диалог 2020, проходить будет в сети http://www.dialog-21.ru/registration/
источник

D

Den in Natural Language Processing
добрый вечер, кто пробовал разворачивать ru_transformers?
источник

V

Vlad in Natural Language Processing
Подскажите пожалуйста, где найти полный список POS тегов, которые может вернуть RNNMorph? Судя по коду теги конвертируются в UD1.4, но нигде не могу найти список этих тегов, везде только UD2.0...

https://github.com/IlyaGusev/rnnmorph/blob/master/rnnmorph/predictor.py#L76
источник

V

Vlad in Natural Language Processing
Вероятно, я нашёл что искал в материалах дорожки по морфологическому анализу "Диалога-2017": https://github.com/dialogue-evaluation/morphoRuEval-2017/blob/master/morphostandard
источник

V

Victoria in Natural Language Processing
Dmitriy Pankov
Кажется, что наиболее общее слово labeling, но может варьироваться от конкретной задачи (разметка классов, выделение сущностей, аннотирования)
Спасибо!
источник
2020 June 06

AS

Anton Strelets in Natural Language Processing
Кто-то сталкивался с генерацией длинных текстов (3000 символов) без потери смысла? Тобеж если задали сгенерировать текст про ноутбук, в начале и в конце будет тематика ноутбуков, а не сначала 4 предложения про ноутбук а пятое про Николая II.
источник

АН

Александр Нагаев... in Natural Language Processing
Gpt?
источник

V

Vic in Natural Language Processing
Anton Strelets
Кто-то сталкивался с генерацией длинных текстов (3000 символов) без потери смысла? Тобеж если задали сгенерировать текст про ноутбук, в начале и в конце будет тематика ноутбуков, а не сначала 4 предложения про ноутбук а пятое про Николая II.
Есть мод gpt он управляется: задаётся начало и концовка и тем самым модель не скатывается в треш.
источник

AB

ANT Berezhnyi in Natural Language Processing
На gpt3 уже кто то пробовал?
источник