Size: a a a

2020 October 31

D

Danya in pro.cxx
Dont strange
Как к чужому вай фай подключиться
Никак
Чужой — значит чужой
Не твоё
Кака
источник

IA

Ilia Abernikhin in pro.cxx
Danya
Никак
Чужой — значит чужой
Не твоё
Кака
+
источник

m

magras in pro.cxx
Ilia Abernikhin
Но а где ветвление то собственно? Вот если по порядку передали елемент на вставку таблица вычислила хеш пришла в нужный бакет (пускай у нас открытая адресация) прошлась по бакету нашла вставила или не вставила если есть или вызвала тотальный рехеш, не понимаю где отрабытывает бренч предиктор
Проблема в том, что после вычисления бакета пайплайн с высокой вероятностью будет сброшен, так как все дальнейшие вычисления будут зависеть от адреса бакета.
источник

m

magras in pro.cxx
Я подозреваю, что это фундаментальная проблема и теория информации может доказать что она нерешаема.
источник

D

Dmitriy in pro.cxx
Ioann_V
но из всех архитектур мне нравится zen 2 от AMD - там очень крутые фишки есть, которых в Интеле нету, ну то есть, очень-очень.
Тем не менее, на циклах они творят странные вещи
источник

D

Dmitriy in pro.cxx
Я уже несколько раз писал, что memcpy vs копирование в цикле только на Haswell+ работает одинаково быстро. А Ivy- и все AMD, включая последние, делают второе почти втрое медленнее
источник

IA

Ilia Abernikhin in pro.cxx
@drMagras спасибо за пищу для поиска и дальнейшего изучения, ибо мой код очень сиььно завязан на хештаблице, причем, не большое совершенно не значительная оптимизация дает честные пару секунд ускорения на каждом милионе треугольников
источник

D

Dmitriy in pro.cxx
Да, по большей части юзкейс сомнительный, но объяснений в доках не нашёл.
источник

I

Ioann_V in pro.cxx
Dmitriy
Я уже несколько раз писал, что memcpy vs копирование в цикле только на Haswell+ работает одинаково быстро. А Ivy- и все AMD, включая последние, делают второе почти втрое медленнее
Что? Я делал фаст мемцпу на симде
источник

I

Ioann_V in pro.cxx
и у меня было одинаково
источник

I

Ioann_V in pro.cxx
а проверял на amd 3900x
источник

D

Dmitriy in pro.cxx
Ioann_V
и у меня было одинаково
Одинаково с чем?
источник

I

Ioann_V in pro.cxx
Dmitriy
Одинаково с чем?
с обычным мемцпу, или rep... команда асма
источник

D

Dmitriy in pro.cxx
Ioann_V
с обычным мемцпу, или rep... команда асма
Моё сообщение просьба перечитать...
источник

D

Dmitriy in pro.cxx
Речь о цикле шла :)
источник

I

Ioann_V in pro.cxx
Dmitriy
Я уже несколько раз писал, что memcpy vs копирование в цикле только на Haswell+ работает одинаково быстро. А Ivy- и все AMD, включая последние, делают второе почти втрое медленнее
я не знаю что есть копирование в цикле
источник

I

Ioann_V in pro.cxx
я в цикле копировал симдом АВХ, или АВХ2, не помню, но код в сети есть, если что.
источник

I

Ioann_V in pro.cxx
а вот на интеле, получалось что симд версия работала на 7% быстрее
источник
2020 November 01

АР

Андрей Руссков... in pro.cxx
обычно оптимизации таких вещей как memcpy контрибьютят сами разработчики процов*, так что оптимизировать вручную - не шибко благодарное занятие.

* можно ли считать это contrib'ом, если intel  - основные мейнтейнеры? )
источник

АР

Андрей Руссков... in pro.cxx
если только, разумеется, ты не уверен что call обойдется тебе дороже самого копирования. Впрочем, обычно в таких случаях компиляторы умеют разворачивать memcpy
источник