Телеграмм чат группы compilerdev страница 2318

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Compiler Development

1050 membersпожаловаться на группу

2021 July 06

AT

Alexander Tchitchigi... in Compiler Development

С этим тоже полностью согласен. 😊

источник

13:08пожаловаться #1

IR

IC Rainbow in Compiler Development

го в мутные типы хотя бы

источник

13:08пожаловаться #2

PM

Pavel Meledin in Compiler Development

@icrbow @GabrielFallen дайте линку где продолжите обсуждение ? 🙂 (интересно топик дальше почитать)

источник

13:21пожаловаться #3

ДК

Дикий Кот in Compiler Development

Ну, мы вот учим на суперкомпьютере, в разных шкафах, и норм. Там есть методы распределённого обучения, да и матрицы можно хранить с учётом топологии. TPU - это, конечно, круто, но не у всех есть.

Другие методы тоже хорошо распараллеливаются по данным.

Ну, и вы путаете градиентный бустиг и спуск.

источник

17:03пожаловаться #4

[

[BRM]White Rabbit in Compiler Development

уже давали пруфы, что градиентный бустинг используют так же и для нейросетей

источник

17:05пожаловаться #5

[

[BRM]White Rabbit in Compiler Development

и разговор ушёл в другой чатик из-за оффтопика

источник

17:06пожаловаться #6

AT

Alexander Tchitchigi... in Compiler Development

Я знаю, что есть методы распределённого обучения. Я говорил, что обучать в одном шкафу быстрее, чем в двух, при условии, что влазит. 🤷‍♀️

источник

17:07пожаловаться #7

ДК

Дикий Кот in Compiler Development

Там много всяких "если". Может и в двух шкафах быстрее быть, если удачно разложить по памяти. Много факторов.

источник

17:11пожаловаться #8

AT

Alexander Tchitchigi... in Compiler Development

Если нейронка fully connected, то не получится "удачно разложить по памяти", а?

источник

17:12пожаловаться #9

AT

Alexander Tchitchigi... in Compiler Development

Обычно pruning таки random, и я не понимаю как такое раскладывать по памяти...

источник

17:13пожаловаться #10

AT

Alexander Tchitchigi... in Compiler Development

Но, может, есть удачные НЕ рандомные?

источник

17:13пожаловаться #11

ДК

Дикий Кот in Compiler Development

Почему не получится? Это просто здоровый многомерный массив, который раскладывается поблочно.

источник

17:14пожаловаться #12

AT

Alexander Tchitchigi... in Compiler Development

Fully connected будет обращаться к памяти другого узла. 🤷‍♀️

источник

17:15пожаловаться #13

AT

Alexander Tchitchigi... in Compiler Development

С другой стороны, есть DMA, но это всё равно не шибко быстро.

источник

17:15пожаловаться #14

ДК

Дикий Кот in Compiler Development

Так там же будет не простое умножение, а параллельное. Обращаться будет, но не ко всем данным.

источник

17:16пожаловаться #15

ДК

Дикий Кот in Compiler Development

DMA - это очень быстро. Быстрее, чем memcpy может быть.

источник

17:17пожаловаться #16

AT

Alexander Tchitchigi... in Compiler Development

DMA к памяти другого узла, я имел в виду.

источник

17:18пожаловаться #17

AT

Alexander Tchitchigi... in Compiler Development

Не понял, как это. 🤷‍♀️

источник

17:18пожаловаться #18

ДК

Дикий Кот in Compiler Development

Угу. Это тоже может быть быстрее memcpy. InfiniBand так умеет.

источник

17:19пожаловаться #19

ДК

Дикий Кот in Compiler Development

Есть алгоритмы, уменьшающие число копирований. Можно погуглить cannon algorithm, fox algorithm

источник

17:26пожаловаться #20