а если конкурентного нету, то надо вызывать функции для скачивания/выгрузки памяти на проц/видюху?
надо просто дожидаться завершения всех куда-ядер, которые работают с этой памятью (причём со всем блоком, а не только со страницами, которые потенциально читаются и пишутся в ядре)