Size: a a a

Compiler Development

2021 July 06

AT

Alexander Tchitchigi... in Compiler Development
С этим тоже полностью согласен. 😊
источник

IR

IC Rainbow in Compiler Development
го в мутные типы хотя бы
источник

PM

Pavel Meledin in Compiler Development
@icrbow @GabrielFallen дайте линку где продолжите обсуждение ? 🙂 (интересно топик дальше почитать)
источник

ДК

Дикий Кот in Compiler Development
Ну, мы вот учим на суперкомпьютере, в разных шкафах, и норм. Там есть методы распределённого обучения, да и матрицы можно хранить с учётом топологии. TPU - это, конечно, круто, но не у всех есть.

Другие методы тоже хорошо распараллеливаются по данным.

Ну, и вы путаете градиентный бустиг и спуск.
источник

[

[BRM]White Rabbit in Compiler Development
уже давали пруфы, что градиентный бустинг используют так же и для нейросетей
источник

[

[BRM]White Rabbit in Compiler Development
и разговор ушёл в другой чатик из-за оффтопика
источник

AT

Alexander Tchitchigi... in Compiler Development
Я знаю, что есть методы распределённого обучения. Я говорил, что обучать в одном шкафу быстрее, чем в двух, при условии, что влазит. 🤷‍♀️
источник

ДК

Дикий Кот in Compiler Development
Там много всяких "если". Может и в двух шкафах быстрее быть, если удачно разложить по памяти. Много факторов.
источник

AT

Alexander Tchitchigi... in Compiler Development
Если нейронка fully connected, то не получится "удачно разложить по памяти", а?
источник

AT

Alexander Tchitchigi... in Compiler Development
Обычно pruning таки random, и я не понимаю как такое раскладывать по памяти...
источник

AT

Alexander Tchitchigi... in Compiler Development
Но, может, есть удачные НЕ рандомные?
источник

ДК

Дикий Кот in Compiler Development
Почему не получится? Это просто здоровый многомерный массив, который раскладывается поблочно.
источник

AT

Alexander Tchitchigi... in Compiler Development
Fully connected будет обращаться к памяти другого узла. 🤷‍♀️
источник

AT

Alexander Tchitchigi... in Compiler Development
С другой стороны, есть DMA, но это всё равно не шибко быстро.
источник

ДК

Дикий Кот in Compiler Development
Так там же будет не простое умножение, а параллельное. Обращаться будет, но не ко всем данным.
источник

ДК

Дикий Кот in Compiler Development
DMA - это очень быстро. Быстрее, чем memcpy может быть.
источник

AT

Alexander Tchitchigi... in Compiler Development
DMA к памяти другого узла, я имел в виду.
источник

AT

Alexander Tchitchigi... in Compiler Development
Не понял, как это. 🤷‍♀️
источник

ДК

Дикий Кот in Compiler Development
Угу. Это тоже может быть быстрее memcpy. InfiniBand так умеет.
источник

ДК

Дикий Кот in Compiler Development
Есть алгоритмы, уменьшающие число копирований. Можно погуглить cannon algorithm, fox algorithm
источник