Size: a a a

2019 April 18
DL in NLP
На охране должны начать пускать
Если не пускают, пишите @dropout05
источник
2019 April 19
DL in NLP
#допдня всем, кто занимается style transfer
Очень советую использовать результаты этой статьи для оценки качества вашей модели

arxiv.org/pdf/1904.02295.pdf
источник
DL in NLP
Опрос о занятиях на майские:
Посмотрим какому числу людей это интересно

https://forms.gle/xpsbZJrDBt2S1cL28

И напоминаю про промежуточный опрос о курсе. Пожалуйста, кто его ещё не прошёл -  пройдите. В особенности, если вы перестали ходить на курс.

https://forms.gle/pjDXbbom9DFEuVv3A
источник
DL in NLP
Ответили всем по project propoasl

Баллы за него есть в этой табличке.
Если вы не можете найти себя, пишите на nlp_course@ipavlov.ai

Если название вашего проекта указано неправильно - тоже пишите

https://docs.google.com/spreadsheets/d/1KNsZcAFNREdOxmnbrqq6G9oiBvG7bPAL439m4jIYePE/edit?usp=sharing
источник
2019 April 20
DL in NLP
Напоминаю, что сегодня в 12 у нас воркшоп
источник
DL in NLP
Для тех, кто в теме: `kotelnikovo`
источник
DL in NLP
Итак, наш last workshop начинается

В этот раз у вас одно из двух заданий на выбор:
Kaggle: https://www.kaggle.com/c/dlinnlp-spring-2019-clf
Или простое задание по машинному переводу от Сэнфорда (оно сильно проще наших обычных домашек)

Kaggle’ры будут оцениваться по ранкам:
top5 людей получают 10 баллов
top10 получают 9 баллов
и так до 5 баллов
Превзойти CNN-бейзлайн обязательно

что-то вроде этого, я ещё точно не придумал 😁
источник
DL in NLP
источник
DL in NLP
источник
2019 April 21
DL in NLP
Видео четвергового семинара по BERT и QA
(будет доступно по этой ссылке, когда YT его дообработает)

https://youtu.be/99CymZY-4Tc
источник
DL in NLP
#Задание к следующему семинару
На следующей неделе поговорим про генеративные модели для текста.

Видео cs224n: https://youtu.be/4uG1NMKNWCU
Видео cs231n: https://youtu.be/5WoItGTWV54 - оно про изображения, но общая теория пересекается с текстами

Квиза, возможно, не будет, но будет много доп материалов. Обязательно прочитайте / просмотрите как можно больше из них. Тема очень объемная и разобрать всё подробно мы не успеем.
источник
DL in NLP
Наверняка, кагглится лучше всего в 11 часов вечера
Поэтому добавил в соревнование толстую пачку неразмеченных данных - ULMfit и друзья вам в помощь
источник
2019 April 22
DL in NLP
Всем привет, в течение ближайших нескольких дней вам начнут писать менторы (либо мы просто огласим списки). Было бы хорошо, чтобы у вас уже были бы какие-нибудь результаты - например первичный анализ данных и бейзлайны.
источник
DL in NLP
#допдня по генеративным моделям:

Generating Sentences from a Continuous Space, Bowman et al. [Google Brain], 2016
Авторы обучили вариационный автокодировщик (VAE) на предложениях, рассказали как это делать (там есть несколько хаков для обучения, без которых ничего не работает). После чего показали возможность семплирования предложений и интерполяции между предложениями в получившемся bottleneck-пространстве VAE.

Завтра будет статья по продолжению этой идеи дальше - ещё одна причина её прочитать)

https://paperswithcode.com/paper/generating-sentences-from-a-continuous-space
источник
2019 April 23
DL in NLP
Второй #допдня по генеративным моделям

Toward controlled generation of text, Hu et al. [CMU], 2017

Авторы используют VAE и схему генератор-дискриминатор (но это не ган☝️) и внедряют в латентное пространство категориальную переменную, которая позволяет контролировать какой-то параметр текста (время, эмоциональная окраска, …).

arxiv.org/abs/1703.00955
источник
DL in NLP
Так как многие уже начали делать проекты, напоминаю ещё раз про то, как примерно рекомендуется оформлять свой код. Лушче завести репозиторий пораньше, чем слишком поздно.

A proposal of good practices for files, folders and models architecture: https://blog.metaflow.fr/tensorflow-a-proposal-of-good-practices-for-files-folders-and-models-architecture-f23171501ae3

TL;DR

- data
- notebooks
 - 0_data.ipynb
 - 1_my_first_experiment.ipynb
 - 2_some_other_strange_notebook_name.ipynb
- my_project_name
 - models
 - trainutils.py
 - datautils.py
 - utils.py
- config.py
- run.py
- README.md
источник
2019 April 25
DL in NLP
(Не)квиз на сегодняшний семинар

Задавайте вопросы по лекции. За хорошие вопросы накинем баллов.

https://forms.gle/QyVsF4vreaaE8ocT8
источник
DL in NLP
dlinnlp
Опрос о занятиях на майские:
Посмотрим какому числу людей это интересно

https://forms.gle/xpsbZJrDBt2S1cL28

И напоминаю про промежуточный опрос о курсе. Пожалуйста, кто его ещё не прошёл -  пройдите. В особенности, если вы перестали ходить на курс.

https://forms.gle/pjDXbbom9DFEuVv3A
И ещё раз напоминаю об опросах (будем ли встречаться на майские и промежуточный о курсе). Пожалуйста, если ещё не сделали - сделайте 🙃
Квизы закроются сегодня за час до семинара
источник
DL in NLP
#допдня - довольно хороший (хотя и набрасывающий на вентилятор) пост на медиуме про самую первую статью по GAN в текстах.

https://medium.com/@yoav.goldberg/an-adversarial-review-of-adversarial-generation-of-natural-language-409ac3378bd7
источник
DL in NLP
Ещё один #допдня, который планировалось запостить пораньше (но всякое бывает).

A brief introduction into variational autoencoders
Мы сегодня будем затрагивать VAE, неплохо было бы разобраться в том, что это такое до семинара. Они были в лекции cs231n, но мне кажется, чтобы понять VAE одного описания недостаточно.

За ссылку спасибо @labdmitriy

http://bjlkeng.github.io/posts/variational-autoencoders/
источник