Лучшие cuda вопросы ИТ разработчиков

  • 13 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Как вызвать функцию хоста в ядре CUDA?

Как следует из следующей ошибки, вызов функции хоста ('rand') в ядре недопустим, и мне интересно, есть ли решение для этого, если мне нужно это сделать. error: calling a host function("rand") from a __device__/__global__ function("xS_v1_cuda") ...

Задан 30 Mar 2012, 03:52 от Hailiang Zhang
  • 8 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

В результате может показаться, что нет способа профилировать код OpenCL, работающий на оборудовании NVIDIA, с использованием инструментария CUDA.

аюсь профилировать приложение OpenCL,

Задан 17 Jan 2017, 13:56 от csehydrogen
  • 6 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

 Однако вам нужно написать C / C ++ для самого OpenCL.

ли я создавать приложения CUDA / OpenCL, используя Delphi или FreePascal? Или я вынужден использовать C ++ и Visual Studio? Быстрый поиск:куда + паскаль [http://www.google.com/search?btnG=1&pws=0&q=cuda%20pascal] Появляются некоторые ...

Задан 06 May 2011, 23:30 от Johan
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

применение функции CUDA поэлементно в CUDA

После умножения матрицы A и вектора x на результат y я хочу применить функцию h поэлементно к y.Я хочу получить z = h (Ax), где h применяется поэлементно к в...

Задан 05 Oct 2015, 19:00 от Alberto Contador
  • 3 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

CUDA Thrust: redu_by_key только для некоторых значений в массиве, основываясь на значениях в «ключевом» массиве

Позволять'скажем, у меня есть два device_vector <байт> массивы,

Задан 13 Apr 2013, 13:03 от JohnDoe
  • 36 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Другим хорошим ресурсом для этого вопроса являются некоторые примеры кода, поставляемые с инструментарием CUDA. В этих примерах кода вы можете найти примеры практически любой вещи, которую вы можете себе представить. Одним из вопросов, который имеет отношение к вашему вопросу, является файл quadtree.cu. Удачи.

ал повсюду, чтобы понять, как именно использовать классы с CUDA, и, хотя существует общее мнение, что это можно сделать, и, очевидно, это делают люди, мне было трудно понять, как на самом деле сделай это. У меня есть класс, который реализует ...

Задан 08 Aug 2011, 06:48 от secshunayt
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

Версии GPU алгоритмов OpenCV медленнее, чем версии CPU на моем компьютере?

Пытаясь ускорить простой алгоритм с использованием графического процессора с OpenCV, я заметил, что на моей машине (Ubuntu 12.10, NVidia 9800GT, Cuda 4.2.9, g ++ 4.7.2) версия графического процессора на самом деле медленнее, чем ...

Задан 27 Jan 2013, 19:03 от Tobias Hermann
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

Функция Pow CUDA с целочисленными аргументами

Я новичок в CUDA, и не могу понять, что яя делаю неправильно.m пытается вычислить расстояние до объекта, у которого есть идентификатор в массиве, ось x в мас...

Задан 05 May 2013, 04:53 от Alamin
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

опция nvprof для пропускной способности

Как правильно выбрать измерение полосы пропускания с помощью nvprof --metrics из командной строки? Я использую flop_dp_efficiency для получения процента пико...

Задан 09 Jun 2016, 17:36 от user1382302
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

Почему у GK110 192 ядра и 4 основы?

Я хотел почувствовать архитектуру Кеплера, но это не имеет смысла для меня.Если деформация состоит из 32 потоков, и 4 из них будут запланированы / выполнены,...

Задан 28 Sep 2014, 03:45 от Peezy
  • 0 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Проблемы генерации простых чисел с CUDA

Я просто смотрю с Cuda, и после просмотра учебников векторной суммыВот Я думал, что попробую что-то с нуля, чтобы действительно получить мои ноги под себя.Те...

Задан 21 Sep 2016, 06:05 от kpie
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

Можно ли использовать строковые типы данных в ядрах C ++ CUDA?

Я пишу ядро CUDA, в котором я используюstring тип данных в C ++. Однако компилятор выдает следующую ошибку: error: calling a host function("std::basic_string<char, std::char_traits<char>, std::allocator<char> >::operator =") from a ...

Задан 28 Mar 2012, 15:24 от Programmer
  • 9 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

у меня похожая проблема

ьно часто я получаю библиотеку CUDA с полным отказом и возвращаюсь с ошибкой 46 («все устройства с поддержкой CUDA заняты или недоступны») даже для простых вызовов, таких как cudaMalloc. Код запускается успешно, если я перезагружаю компьютер, но ...

Задан 06 Aug 2011, 11:28 от Stefano Borini
  • 62 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Сообщение об ошибке: не удается найти или открыть файл PDB

Я попытался запустить примеры программ, представленных наNVIDIA»с официального сайта, Большинство программ работали без сбоев, за исключением немногих, где я...

Задан 10 Apr 2013, 20:34 от KNU
  • 66 голосов
  • 12 ответов
  • 0 просмотров
12 ответов

команда top для графических процессоров, использующих CUDA

Я пытаюсь отслеживать процесс, который использует cuda и MPI, есть ли способ, которым я мог бы сделать это, что-то вроде команды "top", но который также контролирует GPU?

Задан 22 Nov 2011, 08:19 от natorro
  • 2 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

 полагаться на это поведение, хотя.

чебника, который я пишу, я ищу «реалистичный» и простой пример тупика, вызванного незнанием SIMT / SIMD. Я придумал этот фрагмент, который, кажется, хороший пример. Любой вклад будет оценен. … int x = threadID / 2; if (threadID > x) { ...

Задан 21 Jun 2011, 14:18 от Framester
  • 2 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Тяга Сортировка по ключу на лету или другой подход?

Мне было интересно, можно ли сортировать по ключам с помощью Thrust Library без необходимости создания вектора для хранения ключей (на лету). Например, у мен...

Задан 08 Jul 2014, 13:04 от Walter white
  • 11 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Несколько процессов, запускающих ядра CUDA параллельно

Я знаю, что NVIDIA GPU с вычислительной способностью 2.x или выше может выполнять до 16 ядер одновременно. Тем не менее, мое приложение порождает 7 &quot;про...

Задан 15 Feb 2013, 11:46 от user2075543
  • 3 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Объединение двух списков по ключу с помощью Thrust

Учитывая два списка значений ключа, я пытаюсь объединить две стороны, сопоставляя ключи и применяя функцию к двум значениям, когда ключи совпадают. В моем сл...

Задан 19 Dec 2015, 11:31 от Patrick Kostjens
  • 5 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

CUDA: шаблон рассеяния связи

Я изучаю CUDA от Udacity&#39;sкурс на параллельном программировании. В викторине у них есть проблема сортировки предварительно ранжированной переменной (рост...

Задан 10 Jan 2015, 09:16 от Tanay
  • 8 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Cuda Clang и OS X Mavericks

В настоящее время я пытаюсь создать проект Cuda с Cmake на MacOS 10.9. Мой компилятор C и C ++ - gcc, но, похоже, поскольку Mavericks gcc и g ++ ссылаются на...

Задан 13 Oct 2013, 20:48 от Arthur Pajot
  • 6 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

CUDA и закрепленная (страница заблокирована) память не заблокирована страница вообще?

Я пытаюсь выяснить, говорит ли CUDA (или реализация OpenCL) правду, когда мне требуется закрепленная (заблокированная страница) память.Я старался

Задан 12 Nov 2014, 14:05 от Michael Haidl
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

Спасибо за добавление ответа на ваш вопрос. Пожалуйста, не забудьте вернуться через несколько дней и принять ваш ответ, чтобы вопрос не попал в список без ответа для тега CUDA.

ставляет ли использование хранения данных в постоянной памяти какое-либо преимущество по сравнению с текстурой в архитектуре Pascal, если частота потоков данных очень высока среди потоков (каждый поток выбирает по крайней мере один данные из ...

Задан 19 Sep 2017, 01:30 от Thiago Conrado
  • 7 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Сбой компиляции кода, содержащего динамический параллелизм

Я занимаюсь программированием динамического параллелизма с использованием CUDA 5.5 и NVDIA GeForce GTX 780, вычислительная мощность которых составляет 3,5. Я...

Задан 10 Oct 2013, 03:04 от user2865500
  • 16 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Переменная массива Cuda Shared Memory

Я пытаюсь объявить переменную для умножения матриц следующим образом: __shared__ float As[BLOCK_SIZE][BLOCK_SIZE];Я пытаюсь сделать так, чтобы пользователь мог ввести размер матрицы для вычисления, однако это означало бы изменение BLOCK_SIZE. Я ...

Задан 08 Feb 2012, 04:36 от Dan
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

копировать данные, которые размещены в устройстве, с устройства на хост

У меня есть указатель, который динамически размещается в устройстве, то как я могу скопировать его с устройства на хост? #include <stdio.h> #define cudaSafeCall(call){ \ cudaError err = call; \ if(cudaSuccess != err){ \ fprintf(stderr, "%s(%i) : ...

Задан 30 Nov 2011, 07:35 от helena
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

Оценка выражений, состоящих из поэлементных матричных операций в Thrust

Я хотел бы использовать Thrust для оценки выражений, состоящих из поэлементных матричных операций. Чтобы было понятно, рассмотрим выражение вроде: D=A*B+3*sin(C) гдеA, B, C а такжеD Матрицы, конечно же, одного размера. Краткое руководство по ...

Задан 05 Jul 2013, 11:00 от JackOLantern
  • 2 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Функция-член объекта C ++ как функция CUDA __global__

У меня есть базовый класс: template <class T> class A{ public: // some data T data; //some functions like constructs etc. ... // one virtual function virtual void evaluate() = 0; }и производный класс: template <class T> class B:public A<T>{ ...

Задан 08 Jul 2013, 21:04 от user1612986
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

Cuda производительность без копий

Кто-нибудь имеет опыт анализа производительности приложений CUDA с использованием нулевой копии (ссылка здесь:Прикрепленная по умолчанию память против памяти с нулевым ...

Задан 14 Dec 2012, 01:38 от user926914
  • 7 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Как нормализовать матричные столбцы в CUDA с максимальной производительностью?

Как эффективно нормализовать матричные столбцы в CUDA? Моя матрица хранится в столбце-мажоре, и типичный размер - 2000x200. Операция может быть представлена в следующем коде Matlab. A = rand(2000,200); A = exp(A); A = A./repmat(sum(A,1), ...

Задан 08 Jan 2013, 08:35 от kangshiyin
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

Cuda версия не работает во время серийной работы

мой следующий минималистский код Cuda возвращает неверный результат (все полигоны имеют 0 вершин в конце), в то время как один и тот же код, работающий после...

Задан 29 Nov 2012, 15:58 от WhitAngl
  • 6 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Закрепленная память в CUDA

Я где-то читал, что закрепленная память в CUDA является дефицитным источником. Какова верхняя граница закрепленной памяти? В Windows, в Linux?

Задан 15 Sep 2012, 18:04 от username_4567
  • 3 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

cmake: Специфичные для цели определения препроцессора для целей CUDA, похоже, не работают

Я использую cmake 2.8.1 на Mac OSX 10.6 с CUDA 3.0.Поэтому я добавил цель CUDA, для которой нужно BLOCK_SIZE установить какое-то число для компиляции.

Задан 16 May 2010, 08:39 от Nils
  • 3 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Преобразование октавы для использования CuBLAS

Я хотел бы преобразовать Octave, чтобы использовать CuBLAS для умножения матриц. Это видео, кажется, показывает, что это так же просто, как набрать 28 символов: Использование библиотеки CUDA для ускорения ...

Задан 05 Jul 2013, 16:25 от Waylon Flinn
  • 2 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

Компилятор Cuda не работает с GCC 4.5+

Я новичок в Cuda, и я пытаюсь скомпилировать этот простойtest_1.cu файл: #include <stdio.h> __global__ void kernel(void) { } int main (void) { kernel<<<1,1>>>(); printf( "Hello, World!\n"); return 0; }используя это:nvcc test_1.cu Я получаю ...

Задан 22 Dec 2011, 01:46 от Test Test
Page 1 of 16
1 2 3 4 5