1. 书籍
  2. 详情

《GPU高性能运算之CUDA》电子书

基本信息

  • 书籍大小:未知
  • 书籍语言:简体中文
  • 书籍类别:编程开发
  • 书籍标签:编程开发
  • 购买链接: 京东   淘宝

打开支付宝首页搜“673273051”领红包,领到大红包的小伙伴赶紧使用哦!

相关书籍

内容介绍



目录

前言
第1章 GPU通用计算
1.1 多核计算的发展
1.1.1 CPU多核并行
1.1.2 超级计算机、集群与分布式计算
1.1.3 CPU+GPU异构并行
1.2 GPU发展简介
1.2.1 GPU渲染流水线
1.2.2 着色器模型
1.2.3 NVIDIA GPU发展简介
1.3 从GPGPU到CUDA
1.3.1 传统GPGPU开发
1.3.2 CUDA开发

第2章 CUDA基础
2.1 CUDA编程模型
2.1.1 主机与设备
2.1.2 Kernel函数的定义与调用
2.1.3 线程结构
2.1.4 硬件映射
2.1.5 deviceQuery示例
2.1.6 matrixAssign示例
2.2 CUDA软件体系
2.2.1 CUDA C语言
2.2.2 nvcc编译器
2.2.3 运行时API与驱动API
2.2.4 CUDA函数库
2.3 CUDA存储器模型
2.3.1 寄存器
2.3.2 局部存储器
2.3.3 共享存储器
2.3.4 全局存储器
2.3 5 主机端内存
2.3.6 主机端页锁定内存
2.3.7 常数存储器
2.3.8 纹理存储器
2.4 CUDA通信机制
2.4.1 同步函数
2.4.2 Volatile关键字
2.4.3 ATOM操作
2.4.4 VOTE操作
2.5 异步并行执行
2.5.1 流
2.5.2 事件
2.6 CUDA与图形学API互操作
2.6.1 CUDA与OpenGL的互操作
2.6.2 CUDA与Direct3D互操作
2.7 多设备与设备集群
2.7.1 CUDA设备控制
2.7.2 CUDA与openMP
2.7.3 CUDA与集群

第3章 CUDA硬件架构
3.1 NVIDIA显卡构造简介
3.1.1 图形显卡概览
3.1.2 PCI-E总线
3.1.3 显存
3.1.4 GPU芯片
3.2 Tesla图形与计算架构
3.2.1 SPA-TPC-SM
3.2.2 主流GPU架构
3.3 Tesla通用计算模型
3.3.1 数据与指令的加载
3.3.2 warp指令的发射与执行
3.3.3 纹理、渲染和存储器流水线

第4章 CUDA程序的优化
4.1 CUDA程序优化概述
4.2 测量程序运行时间
4.2.1 设备端测时
4.2.2 主机端测时
4.3 任务划分
4.3.1 任务划分原则
4.3.2 grid和block维度设计
4.4 存储器访问优化
4.4.1 主机-设备通信优化
4.4 2全局存储器访问优化
4.4.3 共享存储器访问优化
4.4.4 使用纹理存储器和常数存储器加速
4.5 指令流优化
4.5.1 算术指令
4.5.2 控制流指令
4.5.3 访存指令
4.5.4 同步指令
4.6 CURDAprofiler的使用
4.6.1 图形分析
4.6.2 图表分析
4.7 优化应用举例
4.7.1 矩阵乘法的优化
4.7.2 并行归约的优化
4.7.3 矩阵转置的优化

第5章 综合应用
5.1 基本应用
5.1.1 双调排序网络
5.1.2 Scan
5.1.3 CUBLAS简单应用
5.1.4 CUFFT简单应用
5.2 高级应用
5.2.1 共轭梯度法的CUBLAS实现
5.2.2 AC多模式匹配算法的CUDA实现

附录A 安装、配置、编译及调试
附录B 常见问题与解答
附录C 技术规范
附录D C扩展
附录E 数学函数
附录F 纹理拾取
附录G 着色器模型

下载地址

打赏