Áttekintés
A Globális memória tehát egy nagy méretű CPU-ról és GPU-ról is írható, olvasható memóriaterület. A kernelek innen kezdik az olvasást.
Fontos viszont, hogy a globális memória olvasásának költsége van. alapvetően midnen hozzáférés 400-600 órajel várakozásra kényszeríti a szálakat.
- Ez az egyik oka, hogy érdemes sok szálat indítani a blokkokon belül. Amíg egy szál várakozik az adatra, addig egy másik aktívvá tud vaálni.
A Globális memória foglalása a CPU-n történik a korábban ismertetett módon. A kernel viszont nem foglalhat memóriát.
A memória elérése
- A CPU oldalróül a memória elérése kizárólag a cudaMemcpy függvénnyel lehetséges;
- A GPU kódban a normál pointer kezelés, és tömb indexelés használható.