CUDA
一、CUDA矩阵加饭
1.1 CUDA程序基本框架

1.2 设置GPU设备

1.3 内存管理






- 主机不能调用设备函数
二、CUDA错误检查
1. 运行时API错误代码

2. 错误检查函数


3. 检查核函数

三、CUDA计时
1. 时间计时

2. nvprof性能剖析

nsys nvprof ./***
四、运行时GPU信息查询
1. 运行时API查询GPU信息


1 | |
2. 查询GPU计算核心数量
五、组织线程模型
1. 二维网格二维线程块



nx = blockDim.x * gridDim.x
nx: 矩阵宽
ny:矩阵长
2. 二维网格一维线程块


3. 一维网格一维线程块

Matrix Plus
http://chenxindaaa.com/Infra/CUDA/infra/matrixAdd/