因为课程学习需要,配置英伟达的cuda环境做高性能计算的测试。
1.cuda的安装
首先要去英伟达的官网下载安装cuda,安装路径可以自由选择,但是为了方便操作建议直接全部默认安装。
可以现在命令行执行nvidia-smi.exe查看目前显卡支持的最高cuda版本,右上角的cuda version就是我们要确认的版本,下载的cuda不应该比这个版本新。
cuda下载入口:CUDA Toolkit 12.1 Update 1 Downloads | NVIDIA Developer
进去后选择对应的平台和版本
2.检查环境配置
正常情况下安装完成后是会自动配置环境变量的,但是为了保险我们还是去命令行看一下
执行nvcc -V,若可以正常显示版本号等信息,说明正常安装。
3.配置vscode
cuda编程用的是.cu文件,我这里为了操作简单用了coderunner插件,配置.cu文件的编译
点击小齿轮选择扩展设置
我们直接在settings.json中编辑
在"code-runner.executorMap": {}中加入cu文件的编译语句
"cu": "cd $dir; nvcc $fileName -o $fileNameWithoutExt.exe -I'C:\\Program Files\\NVIDIA GPU Computing Toolkit\\CUDA\\v11.7\\include\\CL' && $dir$fileNameWithoutExt", //请设置和你的安装路径一致的地址
然后我们在.cu文件的右上角点击运行符号选择用coderunner运行
下面是一个测试小程序
#include <iostream> #include <math.h> __global__ void add(int n, float *x, float *y) { for (int i = 0; i < n; i++) y[i] = x[i] + y[i]; } int main(void) { int N = 1<<25; float *x, *y; cudaMallocManaged(&x, N*sizeof(float)); cudaMallocManaged(&y, N*sizeof(float)); for (int i = 0; i < N; i++) { x[i] = 1.0f; y[i] = 2.0f; } add<<<1, 1>>>(N, x, y); cudaDeviceSynchronize(); float maxError = 0.0f; for (int i = 0; i < N; i++) maxError = fmax(maxError, fabs(y[i]-3.0f)); std::cout << "Max error: " << maxError << std::endl; cudaFree(x); cudaFree(y); return 0; }
正常运行结果如下
这里可能会返回一个错误,大意是在path找不到cl.exe
如果是这个情况我们可以添加一个path系统环境变量
C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.33.31629\bin\Hostx64\x64 //注意这里要找到你电脑上的visual studio安装路径,找到这个文件,bin目录下面可能有两个文件夹,但是cuda运行一定要选择x64
然后重启你的vscode,再用coderunner就能正常运行啦