Я использую QR- и LU-разложение и функции решения для разреженных матриц из библиотеки CUDA cuSolver. Согласно документации, функция LU доступна только на хост-пути, тогда как функции QR также доступны на устройстве.
Мне было интересно, есть ли какие-либо настройки или аналогичные для управления настройками параллелизма для функций хоста и устройства. Как контролируется количество потоков для обоих типов функций?
Настройки распараллеливания для функций cuSolver на хосте и устройстве
8 августа 2021 в 19:56
46
1
Ответы (1)
9 августа 2021 в 04:25
Нет никаких настроек параллелизма.
Количество потоков нельзя контролировать напрямую, и нет общедоступного описания того, как работает функция на запрашиваемом вами уровне.
Библиотека непрозрачна. Количество потоков, связанных с любым вызовом ядра, который запускается вызовом библиотеки, будет определяться эвристикой, используемой библиотекой, которая не описана.
.