Size: a a a

Natural Language Processing

2021 December 15

DD

David Dale in Natural Language Processing
Вот тут можно скачать такой список: https://ruscorpora.ru/new/corpora-freq.html
источник

А

А in Natural Language Processing
Мне бы на английском, а затем с ним еще поработать по   collocations
источник

Eg

Elena gisly in Natural Language Processing
по готовым корпусам также есть готовые такие списки, можно тут, к примеру, посмотреть:
https://app.sketchengine.eu/#dashboard?corpname=preloaded%2Fbawe2
источник

MB

Mark Baushenko in Natural Language Processing
Всем доброготвремени суток! После тюна LM text2text она на инференсе плюется скобками или точками, что могло пойти не так?
источник

ZP

Z P in Natural Language Processing
Кто нибудь получал вектор не с последнего слоя gpt а с пред. последнего? Как это сделать?
источник

d

dePuff in Natural Language Processing
eos токен вышел из чата\настроек\данных для обучения
источник
2021 December 16

NR

Nikita Repeev in Natural Language Processing
источник

ZP

Z P in Natural Language Processing
Спасибо!
источник

ММ

Михаил Митрофанов... in Natural Language Processing
Всем доброго дня! Может быть не по адресу, можете посоветовать как реализовать рекомендации на основе содержимого текста ?
источник

A

Andrey in Natural Language Processing
рекомендации чего? сходу - поиском ближайших, и отбор по критериям среди них
источник

ММ

Михаил Митрофанов... in Natural Language Processing
новостей
источник

ММ

Михаил Митрофанов... in Natural Language Processing
я совсем новичёк в этом, а критерии надо предварительно разметить ?
источник

A

Andrey in Natural Language Processing
надо схожие советовать или по предпочтениям? если первое, то критерии не нужны. если второе - то надо их формализовать.

либо см. collaborative filtering и все в таком духе, либо сетками ранжировать (достаточно нетривиально), либо критериями объявить то, что из новостей пользователь сочтёт интересным (холодный старт).
источник

ММ

Михаил Митрофанов... in Natural Language Processing
спасибо, может посоветуете статью на эту тему ?
источник

AS

Artem Snegirev in Natural Language Processing
привет, я затренил rugpt3-large сбера для диалогов. На префикс "привет" получаю что-то странное:

приветветветветыветыветыветаветаветаветветветеветеветеветветВетВетВет Вет Вет Вет вет вет вет Вет

Я разделял реплики доп. токеном </t>, а диалоги разделял eos токеном. Использовал адаптеры вместо обычного файнтюна. Лосс тоже довольно странно изменялся.

В чем может быть дело?
источник

A

Andrey in Natural Language Processing
источник

ММ

Михаил Митрофанов... in Natural Language Processing
Спасибо
источник

IG

Ilya Gusev in Natural Language Processing
Вторая статья цикла про суммаризацию: https://habr.com/ru/post/595597/
На этот раз всего две экстрактивные модели, но зато очень важные.
источник

IG

Ilya Gusev in Natural Language Processing
И ещё к первой статье допилил Колаб с почти всеми методами: https://colab.research.google.com/drive/1qeENj0BKdlhrNrPzUFnCpS1EE4l0qrJq
источник

SancheZz Мов in Natural Language Processing
Круто
источник