《GPU高性能运算之CUDA》电子书
基本信息
打开支付宝首页搜“673273051”领红包,领到大红包的小伙伴赶紧使用哦!
相关书籍
- 《unity入门教程视频-免费下载》[]
- 《Object Oriented Analysis And Design With Applications》[]
- 《Kafka源码解析与实战》[]
- 《APDL参数化有限元分析技术及其应用实例-ansys-免费下载》[]
- 《ANSYS操作命令与参数化编程-免费下载》[]
- 《新编WindowsAPI参考大全-pdf-免费下载》[]
- 《MATLAB 7.0 基础教程-免费下载》[]
- 《MATLAB应用程序接口用户指南-免费下载》[]
- 《信号分析与处理_MATLAB语言及应用-免费下载》[]
- 《信号分析与处理——MATLAB语言及应用-免费下载》[]
内容介绍
目录:
å‰è¨€
第1ç« GPU通用计算
1.1 å¤šæ ¸è®¡ç®—çš„å‘展
1.1.1 CPUå¤šæ ¸å¹¶è¡Œ
1.1.2 超级计算机ã€é›†ç¾¤ä¸Žåˆ†å¸ƒå¼è®¡ç®—
1.1.3 CPU+GPU异构并行
1.2 GPUå‘展简介
1.2.1 GPUæ¸²æŸ“æµæ°´çº¿
1.2.2 ç€è‰²å™¨æ¨¡åž‹
1.2.3 NVIDIA GPUå‘展简介
1.3 从GPGPU到CUDA
1.3.1 ä¼ ç»ŸGPGPUå¼€å‘
1.3.2 CUDAå¼€å‘
第2ç« CUDA基础
2.1 CUDA编程模型
2.1.1 主机与设备
2.1.2 Kernel函数的定义与调用
2.1.3 线程结构
2.1.4 ç¡¬ä»¶æ˜ å°„
2.1.5 deviceQuery示例
2.1.6 matrixAssign示例
2.2 CUDA软件体系
2.2.1 CUDA Cè¯è¨€
2.2.2 nvcc编译器
2.2.3 è¿è¡Œæ—¶API与驱动API
2.2.4 CUDA函数库
2.3 CUDAå˜å‚¨å™¨æ¨¡åž‹
2.3.1 寄å˜å™¨
2.3.2 局部å˜å‚¨å™¨
2.3.3 共享å˜å‚¨å™¨
2.3.4 全局å˜å‚¨å™¨
2.3 5 主机端内å˜
2.3.6 主机端页é”定内å˜
2.3.7 常数å˜å‚¨å™¨
2.3.8 纹ç†å˜å‚¨å™¨
2.4 CUDA通信机制
2.4.1 åŒæ¥å‡½æ•°
2.4.2 Volatile关键å—
2.4.3 ATOMæ“作
2.4.4 VOTEæ“作
2.5 异æ¥å¹¶è¡Œæ‰§è¡Œ
2.5.1 æµ
2.5.2 事件
2.6 CUDA与图形å¦API互æ“作
2.6.1 CUDA与OpenGL的互æ“作
2.6.2 CUDA与Direct3D互æ“作
2.7 多设备与设备集群
2.7.1 CUDA设备控制
2.7.2 CUDA与openMP
2.7.3 CUDA与集群
第3ç« CUDA硬件架构
3.1 NVIDIAæ˜¾å¡æž„é€ ç®€ä»‹
3.1.1 å›¾å½¢æ˜¾å¡æ¦‚览
3.1.2 PCI-E总线
3.1.3 显å˜
3.1.4 GPU芯片
3.2 Tesla图形与计算架构
3.2.1 SPA-TPC-SM
3.2.2 主æµGPUæž¶æž„
3.3 Tesla通用计算模型
3.3.1 æ•°æ®ä¸ŽæŒ‡ä»¤çš„åŠ è½½
3.3.2 warp指令的å‘射与执行
3.3.3 纹ç†ã€æ¸²æŸ“å’Œå˜å‚¨å™¨æµæ°´çº¿
第4ç« CUDA程åºçš„优化
4.1 CUDA程åºä¼˜åŒ–概述
4.2 测é‡ç¨‹åºè¿è¡Œæ—¶é—´
4.2.1 设备端测时
4.2.2 主机端测时
4.3 任务划分
4.3.1 任务划分原则
4.3.2 grid和block维度设计
4.4 å˜å‚¨å™¨è®¿é—®ä¼˜åŒ–
4.4.1 主机ï¼è®¾å¤‡é€šä¿¡ä¼˜åŒ–
4.4 2全局å˜å‚¨å™¨è®¿é—®ä¼˜åŒ–
4.4.3 共享å˜å‚¨å™¨è®¿é—®ä¼˜åŒ–
4.4.4 使用纹ç†å˜å‚¨å™¨å’Œå¸¸æ•°å˜å‚¨å™¨åŠ é€Ÿ
4.5 指令æµä¼˜åŒ–
4.5.1 算术指令
4.5.2 æŽ§åˆ¶æµæŒ‡ä»¤
4.5.3 è®¿å˜æŒ‡ä»¤
4.5.4 åŒæ¥æŒ‡ä»¤
4.6 CURDAprofiler的使用
4.6.1 图形分æž
4.6.2 图表分æž
4.7 优化应用举例
4.7.1 矩阵乘法的优化
4.7.2 并行归约的优化
4.7.3 矩阵转置的优化
第5ç« ç»¼åˆåº”用
5.1 基本应用
5.1.1 åŒè°ƒæŽ’åºç½‘络
5.1.2 Scan
5.1.3 CUBLAS简å•应用
5.1.4 CUFFT简å•应用
5.2 高级应用
5.2.1 å…±è½æ¢¯åº¦æ³•çš„CUBLAS实现
5.2.2 AC多模å¼åŒ¹é…算法的CUDA实现
附录A 安装ã€é…ç½®ã€ç¼–译åŠè°ƒè¯•
附录B 常è§é—®é¢˜ä¸Žè§£ç”
附录C 技术规范
附录D C扩展
附录E æ•°å¦å‡½æ•°
附录F çº¹ç†æ‹¾å–
附录G ç€è‰²å™¨æ¨¡åž‹
