Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2021 January 11

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Dan • Captain
Если найдёшь способ - пожалуйста поделись. Вангую, что войдёшь в историю и станешь богатым и знаменитым
Вангую что нет😜
источник

D•

Dan • Captain in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Хотя да, о чем это я
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
k k
Ребят, вопрос, а можно как-то модель gpt-2, gpt-3 сжать до 10 Мб ?
А зачем?)
Если языковую модель нужно использовать для какого-то относительно узкого домена и задачи, её в принципе можно сильно ужать дистилляцией.
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Dan • Captain
Если найдёшь способ - пожалуйста поделись. Вангую, что войдёшь в историю и станешь богатым и знаменитым
))
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
В общем-то и так можно, BERT вот довольно успешно сжимали в несколько раз, хоть и не до 10мб.
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
А зачем?)
Если языковую модель нужно использовать для какого-то относительно узкого домена и задачи, её в принципе можно сильно ужать дистилляцией.
Хм..
источник

JR

Jürgen Romins in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Для тех кто хочет поиграться

https://www.katacoda.com/kubeflow
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
А я год назад успешно пожал эмбеддинги fasttext с 2.7 гб до 28 мб https://habr.com/ru/post/489474/
С глубокими нейросетями, конечно, это делается сильно сложнее, но, если очень надо, тоже реализуемо.
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
В общем-то и так можно, BERT вот довольно успешно сжимали в несколько раз, хоть и не до 10мб.
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
А я год назад успешно пожал эмбеддинги fasttext с 2.7 гб до 28 мб https://habr.com/ru/post/489474/
С глубокими нейросетями, конечно, это делается сильно сложнее, но, если очень надо, тоже реализуемо.
Спасибо, попробую
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Да, вполне.
Так зачем понадобилось GPT сжимать? Интересно просто)
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
А я год назад успешно пожал эмбеддинги fasttext с 2.7 гб до 28 мб https://habr.com/ru/post/489474/
С глубокими нейросетями, конечно, это делается сильно сложнее, но, если очень надо, тоже реализуемо.
Ну 10мб для гпт3 это в 100к раз сжатие🙃
источник

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Бтв, сжатие увеличивает bias
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
Да, вполне.
Так зачем понадобилось GPT сжимать? Интересно просто)
Я просто хочу сделать суперинтеллект
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Это что за зверь?
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ivan
Это что за зверь?
Это сильнее , чем слабый и сильный интеллект, и сильнее человеческого интеллекта, будет способен чудеса творить
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
А какой-то ваш ресерч по этой теме посмотреть можно? Чего уже достигли?
источник

D

Den in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
кто в курсе jukebox с русским дружит?
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Добрый день всем. Решил разобраться со свертками и попробовал просчитать вручную решенный пример(1й скрин) средствами кераса. Код на гисте

https://gist.github.com/RinnetenseiQ/9d467e954100eba4a4aba3362c5f950a

Создал модельку из одного сверточного слоя. Зафитил на одном экземпляре, что был на скрине 1 и на нем же и запредиктил. Но я совсем не ожидал, что получатся такие результаты(скр 2 и скр3).
1) Почему у - одно число (заметил, что по факту это среднее между у1 и у2
2) Массив весовых коэффициентов странный, мне казалось он должен быть куда меньшим
х и у на скрине 4
источник

СВ

Сергей Васильев... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник