Телеграмм чат группы natural_language

а её так же, нужно сначала натренировать на гиганском корпусе, а потом фаин тюнить под конкретную задачу и корпус? Или сразу на конкретном корпусе учил?
Или в современном nlp теперь всё делается через трансфер лёрнинг?

источник

21:34пожаловаться #11

Ilya Gusev in Natural Language Processing

А вот хз, насколько это для неё работает. Авторы точно без предобучения тестили

источник

21:38пожаловаться #12

Ilya Gusev in Natural Language Processing

А вот и первые попытки воспроизвести, https://github.com/HazyResearch/state-spaces/issues/3

GitHub

request to load logs for experiments · Issue #3 · HazyResearch/state-spaces

Hi, can you please upload the logs of the experiments that were reported in the paper? I tried to reproduce the wikitext-103 experiment but had to change some configurations due to hardware constra...

источник

21:44пожаловаться #13

ГZ

Гражданин Z in Natural Language Processing

будем наблюдать)

источник

23:37пожаловаться #14

2021 December 15

Z P in Natural Language Processing

Кто нибудь может дать статью по no reapet ngram size. Как он реализуется?

источник

12:06пожаловаться #15

Vic in Natural Language Processing

Есть вопрос по вашей модели Барт https://huggingface.co/IlyaGusev/mbart_ru_sum_gazeta
Учим ее но она падает с ошибкой. Используем либу happytransformer (это надстройка над Хагинфейс transformers), тот же код и датасет для обучения Сберовской русской ruT5 работает на обучение, а вот с Бартом падает.
Может подскажете в чем дело, вот полный трейс ошибки:
https://pastebin.com/6Zw1sCBS

Падение в этом месте:
--> 104 remove_columns=["input", "target"],

и итоговая ошибка
TypeError: int() argument must be a string, a bytes-like object or a number, not 'NoneType'

huggingface.co

IlyaGusev/mbart_ru_sum_gazeta · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

источник

12:33пожаловаться #16

Ilya Gusev in Natural Language Processing

Ох, это как будто бы в последних версиях transformers появилось. Оно ещё до запуска модели падает, на этапе токенизации. Нужно при загрузке токенизатора указать src_lang="en_XX", tgt_lang="ru_RU". На обычный инференс с правильным токенизатором это не влияет.

источник

12:46пожаловаться #17

Vic in Natural Language Processing

Спасибо, попробуем.
Кажется вы предлагаете использовать не версию 4 трансформерс, а более раннюю? Мы просто так и делаем в других задачах, тк генератор в 2.8.0 версии почему-то лучше бывает

источник

13:01пожаловаться #18

Ilya Gusev in Natural Language Processing

Да нет, я предлагаю явно в from_pretrained токенизатора языки указать. Либо уже просто скачать модель заново, я там конфиг уже поправил: https://huggingface.co/IlyaGusev/mbart_ru_sum_gazeta/commit/56aba7873fb373f9324f3e4c3880eccbf20c316d

источник

13:03пожаловаться #19

А in Natural Language Processing

Ребята, простите, если оффтоп. Сам новичок в теме. Нужен человек на небольшую задачу - составить список слов с ранжированием по частоте употребления. Подскажите, где можно поискать.

источник

13:43пожаловаться #20