Телеграмм чат группы natural_language

Size: a a a

Natural Language Processing

3198 membersпожаловаться на группу

2021 November 13

Sergei Markoff in Natural Language Processing

В начале следующей недели. Я кину ссылку сюда.

источник

01:33пожаловаться #1

Max in Natural Language Processing

Понял, спасибо ещё раз)

источник

01:33пожаловаться #2

Sergey Shulga in Natural Language Processing

При подготовке датасета для ner, нужно ли в нем оставлять предложения, в которых вообще нет сущностей, как примеры отсутствия, и если нужно, то насколько много?

источник

18:10пожаловаться #3

Егорка in Natural Language Processing

Обучение или обученные модели сравниваешь?

источник

18:15пожаловаться #4

Sergey Shulga in Natural Language Processing

Именно для обучения

источник

18:16пожаловаться #5

Prohor Gladkikh in Natural Language Processing

Нужно, но нельзя, чтобы предложений без сущностей было >X%. X - по дефолту ~50, дальше надо подбирать, тк зависит от сущностей, длины предожений и проекта.
Подбирать по результатам на валидации, где есть все предложения без сущностей.

источник

18:41пожаловаться #6

Sergey Shulga in Natural Language Processing

Ага, спасибо. Так и думал, только пропорция интересовала. Но до 50 процентов, это не слишком много? Или таким образом добиваемся большей точности?

источник

18:50пожаловаться #7

Prohor Gladkikh in Natural Language Processing

Там trade-off будет: сваливание модели в то, чтобы вообще ничего не предсказывать vs высокий false positive на валидации.

источник

18:52пожаловаться #8

Anton in Natural Language Processing

Новая модель для перевода от FB.
На какую карту она влезет? Вес модели 17,5 Gb🤷‍♂️

https://twitter.com/psuraj28/status/1459546962571587591?t=oevGBOtfEDQ8EGby5iOFbw&s=19

Twitter

Suraj Patil

The WMT21 4.7B dense checkpoints are now available on @huggingface hub 👉 huggingface.co/models?other=w… twitter.com/AIatMeta/statu…

источник

19:46пожаловаться #9

Futorio Franklin in Natural Language Processing

Ну на A100 влезет

источник

19:57пожаловаться #10

Runtime Еггор in Natural Language Processing

V100, p6000, 3090...

источник

20:18пожаловаться #11

Anton in Natural Language Processing

Скорее это был риторический вопрос ))
Что модель уже не использовать "на коленке", на какой-нибудь домашней карте.

источник

20:47пожаловаться #12

2021 November 14

ИМ

Игорь Михайлов... in Natural Language Processing

Всем привет, пишу проект-whitepaper по NLP, нужна консультация сегодня на 1-1.5 часа по используемым технологиям и точности терминологии, заплачу 5-10 тыс.руб. Кто готов помочь, плз пишите в личку.

источник

13:52пожаловаться #13

Below Zero in Natural Language Processing

Привет, задача такая - делать seq2seq из кода в код. Существенно, что словарь на выходе сильно отличается от входного. Какую модель взять, чтобы не собирать все с нуля? у Т5 вроде словари одинаковые

источник

16:56пожаловаться #14

Ilya Gusev in Natural Language Processing

PLBART же https://arxiv.org/abs/2103.06333

источник

17:32пожаловаться #15

Ilya Gusev in Natural Language Processing

и не очень понятно, с чего бы словарям отличаться

источник

17:32пожаловаться #16

Below Zero in Natural Language Processing

На выходе - псевдокод, словарь гораздо меньше