Телеграмм чат группы natural_language

Всем привет! Переобучиваю DeepSpeech на русский язык в гугл колабе, но 13 минут на каждую эпоху - слишком долго для меня сейчас. Какие могут быть выходы из этой ситуации?

источник

11:55пожаловаться #7

Andrey in Natural Language Processing

колаб про?

источник

11:56пожаловаться #8

NKJHF dfd in Natural Language Processing

Нет

источник

11:56пожаловаться #9

Vladimir P in Natural Language Processing

Уменьшить датасет. Обучать в половинной точности

источник

11:59пожаловаться #10

Vladimir P in Natural Language Processing

Увеличить размер батча, если позволяет видеокарта

источник

12:01пожаловаться #11

NKJHF dfd in Natural Language Processing

Спасибо!

источник

12:04пожаловаться #12

Alexander C in Natural Language Processing

🚀 @sberloga организует серию онлайн докладов по NLP (Natural Language Processing).
⌚️ Предварительные даты и время - каждый четверг в 19.00 по Москве.
Дополнительная информация и подробные анонсы в телеграм канале @sberloga за пару дней до доклада. Видео записи этих и предыдущих докладов на ютуб канале - https://www.youtube.com/c/sberloga . Присоединяйтесь - будет интересно:

27 мая. Давид Дале (@cointegrated (Сколтех)) "Предобученные модели для русского языка"

3 июня. Андрей Козлюк (@FutorioFranklin (ПрессИндекс)) "TinyBert: 7.5x smaller and 9.4x faster"

Далее:
Игорь Шаталин "Разрешение кореферентности для русского языка"

А также: Андрей Лукьяненко, Михаил Нефедов, Eгор Плотников,
Александр Абрамов, Леонид Синев, Farid Khafizov

PS
Looking for speakers - Мы постоянно проводим небольшие семинары, где можно поделиться своими знаниями по теме Data Science/Data Engineering. Eсли вы готовы рассказать и/или порекомендовать хорошего докладчика обращайтесь - @boyadzhi или @Alexander_V_C

источник

12:05пожаловаться #13

Andrey in Natural Language Processing

купите, недорого стоит, 10 баксов в месяц

источник

12:06пожаловаться #14

Orzhan Mikhail in Natural Language Processing

А sample=True, top_p, top_k какие? Если там greedy decoding, то температура никак не влияет

источник

13:06пожаловаться #15

Nikolay V. Shmyrev in Natural Language Processing

скачать готовую модель, всё равно в коллабе ничего серьёзного научить не получится.

источник

13:29пожаловаться #16

Maxim Chistogov in Natural Language Processing

С чем связано то, что на колабе не получится ничего серьёзного обучить? Чем он будет хуже для задач CV или NLP в сравнении с использованием собственного GPU сервера?

источник

13:34пожаловаться #17

Nikolay V. Shmyrev in Natural Language Processing

Объём данных гораздо больше, времени надо много. Та же модель от сбербанка 8 дней на 16 V100 учится, лучше её потюнить, чем старый deepspeech мучать. То же можно сказать про модели совы и воск.

источник

13:36пожаловаться #18

Futorio Franklin in Natural Language Processing

Ресурсы довольно ограничены. Тот же жесткий диск с лимитом в 100гб (на всю виртуальную машину) бывает забивается в процессе обучения

источник

13:38пожаловаться #19

Maxim Chistogov in Natural Language Processing

Т.е. основная суть в скорости обучения на очень больших объемах данных, а не в качестве обучения?

источник

13:39пожаловаться #20