Телеграмм чат группы prographon страница 8525

страница 1 может читаться и писаться исключительно на хосте, а страница 2 — на девайсе. И ни разу не будет пересылки. На хосте физических страниц будет аллоцировано — одна, как и на девайсе

источник

01:51пожаловаться #5

alexcher in pro.graphon (and gamedev)

а, даже так

источник

01:51пожаловаться #6

alexcher in pro.graphon (and gamedev)

и при доступе с проца в память, которая есть только у видюхи - оно скопируется, да?

источник

01:52пожаловаться #7

Anatoly Tomilov in pro.graphon (and gamedev)

да, если concurrentManagedAccess == true

источник

01:52пожаловаться #8

Ioann_V in pro.graphon (and gamedev)

Anatoly Tomilov

она может лениво выделяться

По запросу то есть, так? А если запроса нету к ней(странице) то просто, быть помеченной?

источник

01:52пожаловаться #9

Anatoly Tomilov in pro.graphon (and gamedev)

если нет, то надо cudaMemPrefetch* вызывать

источник

01:53пожаловаться #10

alexcher in pro.graphon (and gamedev)

Anatoly Tomilov

да, если concurrentManagedAccess == true

а если конкурентного нету, то надо вызывать функции для скачивания/выгрузки памяти на проц/видюху?

источник

01:53пожаловаться #11

alexcher in pro.graphon (and gamedev)

Anatoly Tomilov

если нет, то надо cudaMemPrefetch* вызывать

а, ну походу да

источник

01:54пожаловаться #12

Anatoly Tomilov in pro.graphon (and gamedev)

Anatoly Tomilov

если нет, то надо cudaMemPrefetch* вызывать

нет. Неправда

источник

01:54пожаловаться #13

Anatoly Tomilov in pro.graphon (and gamedev)

alexcher

а если конкурентного нету, то надо вызывать функции для скачивания/выгрузки памяти на проц/видюху?

надо просто дожидаться завершения всех куда-ядер, которые работают с этой памятью (причём со всем блоком, а не только со страницами, которые потенциально читаются и пишутся в ядре)

источник

01:55пожаловаться #14

alexcher in pro.graphon (and gamedev)

а, ок

источник

01:56пожаловаться #15

Anatoly Tomilov in pro.graphon (and gamedev)

то есть нельзя к блоку доступаться с хоста из отдельного потока, пока в каком-то потоке ядро не завершилось (cudaDeviceSynchronize или cudaStreamSynchronize не вернулось)

источник

01:56пожаловаться #16

alexcher in pro.graphon (and gamedev)

alexcher

а если конкурентного нету, то надо вызывать функции для скачивания/выгрузки памяти на проц/видюху?

я подумал, вызывать такую функцию, она дождется завершения, синхронизирует буферы

источник

01:56пожаловаться #17

alexcher in pro.graphon (and gamedev)

alexcher

а разница между paged и этим в расположении памяти? paged лежит в оперативке, и видюха туда лезет, а direct на видюхе, и проц туда лезет?

а еще, оба этих способа могут работать конкурентно?

источник

02:00пожаловаться #18

alexcher in pro.graphon (and gamedev)

Anatoly Tomilov

directManagedMemAccessFromHost - аналог в Vulkan-е — можно не вызывать invalidate (или flush, не помню)

а раз это аналог вулкана, то в чем разница в вулкане в наличии или отсутствии device local бита?

источник

02:02пожаловаться #19

Anatoly Tomilov in pro.graphon (and gamedev)

Во вулкане скорей всего память реально выделяется на девайсе. Прям конкретные физические страницы отводятся под неё в полном объёме.

источник

02:14пожаловаться #20