Вопрос по – Программирование CUDA - кеши L1 и L2

5

Не могли бы вы объяснить разницу между использованием обоих «L1 и L2»? кэши или «только L2» кеш в программировании CUDA? Чего мне ожидать во время исполнения? Когда я мог ожидать меньшее время GPU? Когда я включаю оба кэша L1 и L2 или просто включаю L2? Спасибо

Ваш Ответ

1   ответ
9

к можно больше объединить доступ к вашей памяти, то есть потоки внутри деформации должны как можно больше получать доступ к данным в том же сегменте 128B (см.Руководство по программированию CUDA для получения дополнительной информации по этой теме).

Некоторые программы не могут быть оптимизированы таким образом, например, их обращения к памяти являются абсолютно случайными. В этих случаях может быть выгодно обходить кэш L1, тем самым избегая загрузки всей строки 128B, когда вам нужно только, например, 4 байта (вы все равно загрузите 32B, поскольку это минимум). Очевидно, что есть повышение эффективности: 4 полезных байта с 128 улучшены до 4 с 32.

Спасибо, Том! Я пока не могу голосовать! Но ваш ответ очень полезен для меня :) Saman I

Похожие вопросы