Телеграмм чат группы natural_language_processing страница 1210

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

2738 membersпожаловаться на группу

2021 May 19

DD

David Dale in Natural Language Processing

Ну да, на выходе из этого последнего слоя (так называемая MLM head) Берт выдает матрицу размера seq_len*vocab_size, где для каждого входного токена дается распределение (в виде логитов) на его возмножные замены.

источник

19:47пожаловаться #1

FF

Futorio Franklin in Natural Language Processing

А [CLS] токен используется параллельно для next sentence prediction получается. Кстати, при сложении эмбеддингов токенов в позиционными эмбеддингами, позиции считаются от [CLS] токена или от неслужебного токена?

источник

19:51пожаловаться #2

FF

Futorio Franklin in Natural Language Processing

В любом случае спасибо за ответ на первую часть вопроса

источник

19:57пожаловаться #3

2021 May 20

MA

Muhammed Alimbetov in Natural Language Processing

Всем привет, какие сайты посоветуете парсить для качественного сбора датасета наподобие пикабу? важно чтобы была фича с эмоциями. Подойдут новостные сайты.

источник

09:31пожаловаться #4

k

kosc in Natural Language Processing

А почему не парсить сам пикабу?

источник

09:39пожаловаться #5

MA

Muhammed Alimbetov in Natural Language Processing

уже спарсил, у них фича с эмоциями вышла недавно, собрал небольшой датасет (около 15k) но этого не достаточно

источник

09:45пожаловаться #6

ML

MOD LAVREEQUE in Natural Language Processing

Попросить знакомых админов чатов на тему свободного общения выгрузить логи?

источник

09:51пожаловаться #7

SM

Sergei Markoff in Natural Language Processing

Приходите посмотреть. В 13:55 в секции «Machine Learning» выступит Татьяна Шаврина, а в 16:05 в секции «Салют + платформы» под её же руководством пройдёт круглый стол «Генеративные языковые модели: возможности и сложности», в котором примут участие Михаил Бурцев, Григорий Сапунов, Иван Ямщиков и ваш покорный слуга. А ещё в этом круглом столе поучаствует один секретный участник 🙂
https://smartdev.ru/

Первая технологическая конференция

Первая технологическая конференция Сбера для разработчиков, инженеров и технологического сообщества. Топ-спикеры, презентация новых устройств и сервисов, инжиниринговые и live-coding сессии в 6 параллельных стримах на бесплатной онлайн-конференции 20 мая 2021 года. Регистрируйтесь на smartdev.ru

источник

10:05пожаловаться #8

OR

Oleg Ruban in Natural Language Processing

записи будут?

источник

10:58пожаловаться #9

SM

Sergei Markoff in Natural Language Processing

будут

источник

10:58пожаловаться #10

YA

Yerlan Amanzholov in Natural Language Processing

Всем привет! Такой чисто теоритический вопрос: мы знаем что в CNN первые слои выделяют более общие признаки, как углы и т.д. Верна ли такая же логика для трансформерных архитектур? Например то что первые слои выделяют признаки на уровне слов

источник

11:07пожаловаться #11

Е

Егорка in Natural Language Processing

Вы сравниваете CNN для изображений и трансформеры для текстов.
Быть может уместнее сравнивать CNN для текстов с трансформерами ? В таких CNN извлекается информация из n-грамм на верхних слоях.

источник

11:12пожаловаться #12

SМ

SancheZz Мов in Natural Language Processing

Трансформеры выбирают оттенки смыслов относительно позиционности и тп. Чем дальше от начала находится блок трансформера (от входа) тем больше разных комбинаций оттенков мы получаем в отображении.

источник

11:12пожаловаться #13

SМ

SancheZz Мов in Natural Language Processing

А теперь самое веселое, что делает visual transformer в CV?)

источник

11:17пожаловаться #14

A

Andrei in Natural Language Processing

а где про это можно почитать?

источник

11:41пожаловаться #15

SМ

SancheZz Мов in Natural Language Processing

На енглише или русском?)

источник

11:42пожаловаться #16

SМ

SancheZz Мов in Natural Language Processing

На русском есть статья с курса deep learning на пальца Attention is all you need

источник

11:43пожаловаться #17

FF

Futorio Franklin in Natural Language Processing

В статье про TinyBert (секция 4.6 Effects of Mapping Function) описывалось, что модель, которая построена из нижних слоёв трансформера справляется лучше с задачами на грамматику, в то время как модель, построенная из верхних слоёв лучше справляется с более абстрактными задачами. Так что, скорее всего, так и есть

источник

11:43пожаловаться #18

SМ

SancheZz Мов in Natural Language Processing

Ее перевод https://m.habr.com/ru/post/341240/

Transformer — новая архитектура нейросетей для работы с последовательностями

Необходимое предисловие: я решил попробовать современный формат несения света в массы и пробую стримить на YouTube про deep learning. В частности, в какой-то момент меня попросили рассказать про...

источник

11:44пожаловаться #19

K

Ksenia in Natural Language Processing

Тьмы таких статей, syntactic/semantic probing of transformers, вот первая ссылка из гугла (относительно старенькая правда, 2019) https://www.aclweb.org/anthology/P19-1356.pdf

источник

11:44пожаловаться #20