Size: a a a

Scalability Camp — распределенный чат [СММщик в отпуске на Бали]

2019 September 20

p

pragus in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
yopp
я не настоящий сварщик, но у памяти и pcie разные контроллеры и они каждый по своему сигнальному пути заведены в cpu
смотря какой cpu. но почти у всех уже контроллеры памяти и pcie прямо в cpu.
источник

y

yopp in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
pragus
смотря какой cpu. но почти у всех уже контроллеры памяти и pcie прямо в cpu.
источник

y

yopp in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
ну вон, quickpath
источник

y

yopp in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
стрелочки ясности не добавляют конечно
источник

y

yopp in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
в зионах вон другие стрелочки рисуют
источник

y

yopp in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
источник

p

pragus in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
источник

y

yopp in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
тут вообще стрелочек нет!
источник

y

yopp in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
картинка из зионов похоже про современную архитектуру интерконнекта. там вообще mesh и запросы ходют куды надо.

https://en.wikichip.org/wiki/intel/mesh_interconnect_architecture
https://silix.com.br/pdf/Intel/Intel_Mesh_Whitepaper.pdf
источник

S

Slach in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
pragus
Плохо - потому что память не растет так быстро, как в последние годы выросли полосы на i/o.

2 порта по 100g - и у нас ~ 20Гб/с, которые полетели в память.

AFAIK, чтение с nvme ssd тоже расходует полосу памяти
ну вообще HBM2 вполне решает эту проблему КМК
источник

S

Slach in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
pragus
а почему именно в L3?
потому что код которому реально нужно 8гигабайт в секунду данных для обработки на CPU
уже точно должен уметь считать L1, L2 miss и использовать SSE \ NEON \ AVX и т.п.
источник

ZO

Zlata Obukhovskaya in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
Оооо
источник

y

yopp in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
Aaaa?
источник
2019 September 21

ZO

Zlata Obukhovskaya in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
yopp
Aaaa?
Люблю такие вайтпейперы
источник

y

yopp in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
Zlata Obukhovskaya
Люблю такие вайтпейперы
Которые отдел маркетинга пишет, да ещё так чтоб враги ни о чём не догадались?)))
источник

p

pragus in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
Slach
потому что код которому реально нужно 8гигабайт в секунду данных для обработки на CPU
уже точно должен уметь считать L1, L2 miss и использовать SSE \ NEON \ AVX и т.п.
странный тезис. вот тот же nginx должен это все делать?
источник

S

Slach in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
pragus
странный тезис. вот тот же nginx должен это все делать?
nginx сам по себе с данными работает не в CPU bound режиме и по факту с данными nginx работает ядро и даже само ядро с этими данными работает очень опосредованно
а 90% нагрузки ложится на DMA контроллер либо системный
либо сетевой карты (да карты современные которые 10Gbit  практически умеют все тоже самое что L3 свитчи. ASIC стоит сходный)
попробуйте порешать на nginx CPU bound задачу, поймете о чем речь
источник

p

pragus in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
Slach
nginx сам по себе с данными работает не в CPU bound режиме и по факту с данными nginx работает ядро и даже само ядро с этими данными работает очень опосредованно
а 90% нагрузки ложится на DMA контроллер либо системный
либо сетевой карты (да карты современные которые 10Gbit  практически умеют все тоже самое что L3 свитчи. ASIC стоит сходный)
попробуйте порешать на nginx CPU bound задачу, поймете о чем речь
Просто nginx - это прекрасный пример где полосы много, а  история про кеши cpu нерелевантна и память становится узким местом.

Про asic вы заблуждаетесь.
источник

S

Slach in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
pragus
Просто nginx - это прекрасный пример где полосы много, а  история про кеши cpu нерелевантна и память становится узким местом.

Про asic вы заблуждаетесь.
😉 дак память становится узким местом потому что данные обрабатывать не надо
и дальше уже вопрос к тому как реализован какой нибудь sendfile и O_DIRECT и будет ли для него возможность сделать 1450000 iops узким местом именно на памяти или нет

в общем да, было бы любопытно взглянуть насколько подтянется у того же badoo скорость отдачи фоток от внедрения подобной железки в hot ноды раздающего CDN
источник

y

yopp in Scalability Camp — распределенный чат [СММщик в отпуске на Бали]
Подобной это какой?
источник