Телеграмм чат группы natural_language_processing страница 1143

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

2653 membersпожаловаться на группу

2021 April 13

СС

Сёрежа Серёжа... in Natural Language Processing

Привет! На прошлом голосовом чате один из выступающих (не запомнил, кто именно :( ) рассказывал, что общался с ребятами из ai dungeon и знает примерно, что и как они там делают (и что у них специфичная надстройка над обычным gpt). Я не прошу рассказывать их инсайды, но можете хотя бы подсказать, в какую сторону копать?

источник

13:16пожаловаться #1

OM

Orzhan Mikhail in Natural Language Processing

Есть блог команды AI dungeon на medium: https://aidungeon.medium.com/ и еще есть старый опенсорс репозиторий https://github.com/Latitude-Archives/AIDungeon
Я не был на голосовом чате, просто мимо проходил

Latitude Team – Medium

Read writing from Latitude Team on Medium. Making AI a tool of creativity and freedom for everyone. https://play.aidungeon.io. Every day, Latitude Team and thousands of other voices read, write, and share important stories on Medium.

источник

13:22пожаловаться #2

Е

Егорка in Natural Language Processing

http://arxiv.org/abs/2104.03474
Вот свежая статья, где получили хороший результат при конкатенации

источник

14:14пожаловаться #3

RS

Ruslan Sabirov in Natural Language Processing

Привет!
Столкнулся с проблемой. Она связана с конкретной задачей, но полагаю, что общие советы по тренировке Трансформеров будут полезны

В дипломе решаю задачу distractor generation (генерация неправильных опций в вопросах с несколькими вариантами ответов).
Делаю на базе статьи о модели BDG, сейчас играюсь с имплементацией от авторов

В оригинале авторы тренировали BERT, подавая ему на вход textparagraph <sep> question <sep> corectanswer <sep> distractor[0:i] <mask>. Авторы тренировали bert-base-cased на RTX Titan, 6 эпох, 30 размер батча

У меня в наличии только P100 / V100. Чтобы уменьшить скорость обучения, я заменил bert на distilbert и уменьшил батч сайз до 12. Тем не менее, тренировка все занимает большое время (10 часов на эпоху).

1. На какие трансформеры еще стоит обратить внимание? Хочется, чтобы модель были сравнима с оригинальным Бертом по качеству, но тренировались гораздо быстрее (чтобы быстро запускать разные эксперименты)
2. Что еще можно изменить в тренировке для ускорения?
Батч сайз увеличить не получается, не хватает памяти gpu. Если уменьшать maxlen, то придется сокращать большое количество семплов

источник

15:51пожаловаться #4

FF

Futorio Franklin in Natural Language Processing

Не подскажете какие есть качественные решения для разбиения текста на предложения? (кроме razdel)

источник

17:05пожаловаться #5

C

Constantin in Natural Language Processing

коль скоро никто не ответил,то предложу свой вариант. Без явной нейронной сети. Регулярки + морфологический анализ

умеет разбивать в предложения и в клаузы

https://github.com/constantin50/separatrice

constantin50/separatrice

Separator is able to split a text into sentences and a sentence into clauses - constantin50/separatrice

источник

17:57пожаловаться #6

РН

Роман Некрасов... in Natural Language Processing

@constantin50, тупиковый путь развития. Модели на Tensorflow (TF) скоро помрут. Присмотритесь в том же маркетплейсе к моделям на PyTorch.

источник

19:35пожаловаться #7

C

Constantin in Natural Language Processing

не спорю, просто нужно обучать на TPU, а в pytorch пока что нестабильно (у вас был опыт? все без проблем запускалось?)

источник

19:38пожаловаться #8

РН

Роман Некрасов... in Natural Language Processing

PyTorch - стабильная библиотека. Опыт Сбера по обучению GPT-3 на базе Pytorch о многом говорит. На одном авторитетном портале видел мнение Бурцева (МФТИ, deeppavlov), что за этой тензорной библиотекой будущее.

источник

19:41пожаловаться #9

C

Constantin in Natural Language Processing

речь идет об обучении на TPU transformer-моделей

источник

19:42пожаловаться #10

C

Constantin in Natural Language Processing

так-то я согласен, что Pytorch наше светлое будущие

источник

19:42пожаловаться #11

C

Constantin in Natural Language Processing

если Вы именно это и имели виду (обучение на TPU), то ок, попробую ещё раз.

источник

19:44пожаловаться #12

SМ

SancheZz Мов in Natural Language Processing

Смешно

источник

19:54пожаловаться #13

SМ

SancheZz Мов in Natural Language Processing

Мы в сбере сберты на тф делаем)) и не забывайте тф2 который имеет уже нетерпеливое исполнение и градиент тейп

источник

19:55пожаловаться #14

SМ

SancheZz Мов in Natural Language Processing

В общем все это вкусовщина

источник

19:58пожаловаться #15

РН

Роман Некрасов... in Natural Language Processing

Спасибо за комментарий)) Поговорим в 2030 или 2035 году (горизонт планирования китайцев, может все подсядем на их фреймворки). Если серьёзно, то динамика и открытость PyTorch пока больше импонирует. Прикладываю картинку из Стэнфордского универа для привлечения внимания. p.s. Полный текст отчёта по ссылке: https://aiindex.stanford.edu/wp-content/uploads/2021/03/2021-AI-Index-Report_Master.pdf

источник

20:00пожаловаться #16

SМ

SancheZz Мов in Natural Language Processing

Тф керас все еще могет

источник

20:07пожаловаться #17

SМ

SancheZz Мов in Natural Language Processing

и если сравнить так же вырос +- как торч по отношению к чистому тф))

источник

20:07пожаловаться #18

SМ

SancheZz Мов in Natural Language Processing

Его динамику вы решили не заметить?)

источник

20:07пожаловаться #19

SМ

SancheZz Мов in Natural Language Processing

Да конечно Шоллет вошел в команду Гугла но это не показатель ли его признания)

источник

20:08пожаловаться #20