【3729XEa110】超算全家桶(CPU+GPU性能优化录播课)_189
课程目录:
001.1.2.1_CUDA软件结构及第一个CUDA程序.mp4 (70.49MB)
002.2.3.1_GPU硬件体系结构.mp4 (156.99MB)
003.2.3.2_实战代码演示.mp4 (48.69MB)
004.1.1_GPU_CUDA并行计算导论.mp4 (99.36MB)
005.2.2.1_CUDA线程层次.mp4 (216.72MB)
006.2.1.1_CUDA 内存管理.mp4 (55.73MB)
007.3.1_Code.mp4 (47.08MB)
008.3.2_代码演示.mp4 (46.55MB)
009.6_CUDA项目_CUDA加速Pytorch.mp4 (138.63MB)
010.5.2_CUDA项目-并行矩阵向量乘_Code.mp4 (70.16MB)
011.1.2.2_课堂实战_第一个CUDA程序:HelloWorld.mp4 (18.19MB)
012.2.1.2_课堂实战:向量相加.mp4 (22.54MB)
013.3.2_流和事件课堂实战.mp4 (141.93MB)
014.4.2_CUDA项目-并行扫描.mp4 (227.68MB)
015.4.2_CUDA项目-并行扫描_Code.mp4 (203.48MB)
016.5.1_CUDA项目-并行矩阵乘_Code.mp4 (219.38MB)
017.5.2_CUDA项目-并行矩阵向量乘.mp4 (102.37MB)
018.6_CUDA项目_CUDA加速Pytorch_代码演示.mp4 (58.77MB)
019.2.2.2_代码演示.mp4 (50.06MB)
020.3.1_CUDA硬件结构与调度.mp4 (199.87MB)
021.3.3_多GPU编程.mp4 (102.13MB)
022.3.3.Code_多GPU实现大规模向量点乘.mp4 (34.89MB)
023.4.1_并行归约项目.mp4 (283.97MB)
024.4.1_并行归约项目_Code.mp4 (21.42MB)
025.5.1_CUDA项目-并行矩阵乘.mp4 (289.24MB)
001.IPP_1.mp4 (159.81MB)
002.IPP-2.mp4 (59.62MB)
003.IPP-3.mp4 (104.65MB)
001.MPI_项目介绍.mp4 (128.66MB)
002.MPI基本概念-1.mp4 (24.73MB)
003.MPI基本概念-2.mp4 (6.99MB)
004.MPI基本概念-3.mp4 (30.45MB)
005.MPI基本概念-4.mp4 (7.67MB)
006.MPI基本概念-5.mp4 (6.61MB)
007.点对点通信(阻塞式)-1.mp4 (3.83MB)
008.点对点通信(阻塞式)-2.mp4 (20.31MB)
009.点对点通信(阻塞式)-3.mp4 (8.86MB)
010.点对点通信(阻塞式)-4.mp4 (4.8MB)
011.点对点通信(阻塞式)-5.mp4 (1.94MB)
012.点对点通信(阻塞式)-6.mp4 (6.2MB)
013.点对点通信(阻塞式)-7.mp4 (3.07MB)
014.点对点通信(阻塞式)-8.mp4 (80.08MB)
015.点对点通信(阻塞式)-9.mp4 (5.79MB)
016.点对点通信(阻塞式)-10.mp4 (4.79MB)
017.点对点通信(阻塞式)-11.mp4 (7.08MB)
018.点对点通信(阻塞式)-12.mp4 (45.93MB)
019.点对点通信(非阻塞式)-1.mp4 (12.25MB)
020.点对点通信(非阻塞式)-2.mp4 (8.41MB)
021.点对点通信(非阻塞式)-3.mp4 (3.28MB)
022.点对点通信(非阻塞式)-4.mp4 (7.63MB)
023.点对点通信(非阻塞式)-5.mp4 (6.62MB)
024.点对点通信(非阻塞式)-6.mp4 (9.85MB)
025.集合通信-1.mp4 (5.66MB)
026.集合通信-2.mp4 (8.92MB)
027.集合通信-3.mp4 (8.99MB)
028.集合通信-4.mp4 (8.97MB)
029.集合通信-5.mp4 (2.4MB)
030.集合通信-6.mp4 (2.75MB)
031.集合通信-7.mp4 (83.3MB)
032.集合通信-8.mp4 (9.58MB)
033.通信模式和虚拟进程拓扑-1.mp4 (28.25MB)
034.通信模式和虚拟进程拓扑-2.mp4 (18.88MB)
035.mpi_cannon_项目.mp4 (133.77MB)
001.OpenMP基本概念-1.mp4 (19.48MB)
002.OpenMP基本概念-2.mp4 (8.61MB)
003.OpenMP基本概念-3.mp4 (14.46MB)
004.OpenMP基本概念-4.mp4 (13.31MB)
005.OpenMP基本概念-5.mp4 (6.07MB)
006.OpenMP并行程序基础设计-1.mp4 (12.48MB)
007.OpenMP并行程序基础设计-2.mp4 (18.19MB)
008.OpenMP并行程序基础设计-3.mp4 (11.16MB)
009.OpenMP并行程序基础设计-4.mp4 (41.85MB)
010.OpenMP并行程序基础设计-5.mp4 (5.86MB)
011.OpenMP并行程序基础设计-6.mp4 (33.54MB)
012.OpenMP并行程序基础设计-7.mp4 (60.94MB)
013.循环体for结构-1.mp4 (21.39MB)
014.循环体for结构-2.mp4 (8.9MB)
015.循环体for结构-3.mp4 (39.34MB)
016.循环体for结构-4.mp4 (12.42MB)
017.循环体for结构-5.mp4 (11.58MB)
018.循环体for结构-6.mp4 (30.09MB)
019.循环体for结构-7.mp4 (9.75MB)
020.其他指令-1.mp4 (31.59MB)
021.其他指令-2.mp4 (5.23MB)
022.其他指令-3.mp4 (17.62MB)
023.其他指令-4.mp4 (45.38MB)
024.其他指令-5.mp4 (51.16MB)
025.其他指令-6.mp4 (11.49MB)
001.SIMD基本概念及编程入门-1.mp4 (21.32MB)
002.SIMD基本概念及编程入门-2.mp4 (25.26MB)
003.SIMD基本概念及编程入门-3.mp4 (20.28MB)
004.SIMD基本概念及编程入门-4.mp4 (50.02MB)
005.SIMD基本概念及编程入门-5.mp4 (26.65MB)
006.自动向量化-1.mp4 (35.01MB)
007.自动向量化-2.mp4 (35.83MB)
008.自动向量化-3.mp4 (41.39MB)
009.自动向量化-4.mp4 (51.96MB)
010.NEON-intrinsic指令集-命令规范与存取操作-1.mp4 (7.87MB)
011.NEON-intrinsic指令集-命令规范与存取操作-2.mp4 (13.24MB)
012.NEON-intrinsic指令集-命令规范与存取操作-3.mp4 (22.66MB)
013.NEON-intrinsic指令集-命令规范与存取操作-4.mp4 (32.87MB)
014.NEON-intrinsic指令集-命令规范与存取操作-5.mp4 (20.67MB)
015.NEON-intrinsic指令集-命令规范与存取操作-6.mp4 (19.55MB)
016.NEON-intrinsic指令集-命令规范与存取操作-7.mp4 (15.98MB)
017.NEON-intrinsic指令集-命令规范与存取操作-8.mp4 (43.8MB)
018.NEON-intrinsic指令集-命令规范与存取操作-9.mp4 (21.2MB)
019.NEON-intrinsic指令集-计算操作-1.mp4 (51.27MB)
020.NEON-intrinsic指令集-计算操作-2.mp4 (12.33MB)
021.NEON-intrinsic指令集-计算操作-3.mp4 (32.23MB)
022.NEON-intrinsic指令集-计算操作-4.mp4 (10.24MB)
023.NEON-intrinsic指令集-计算操作-5.mp4 (26.46MB)
024.NEON-intrinsic指令集-计算操作-6.mp4 (4.14MB)
025.NEON-intrinsic指令集-计算操作-7.mp4 (16.4MB)
026.NEON-intrinsic其他常用操作-1.mp4 (20.66MB)
027.NEON-intrinsic其他常用操作-2.mp4 (3.24MB)
028.NEON-intrinsic其他常用操作-3.mp4 (14.97MB)
029.NEON-intrinsic其他常用操作-4.mp4 (3.03MB)
030.NEON-intrinsic其他常用操作-5.mp4 (9.23MB)
031.NEON-intrinsic其他常用操作-6.mp4 (8.12MB)
032.NEON-intrinsic其他常用操作-7.mp4 (2.33MB)
033.NEON-intrinsic其他常用操作-8.mp4 (13.88MB)
034.NEON-intrinsic其他常用操作-9.mp4 (10.99MB)
035.NEON-intrinsic其他常用操作-10.mp4 (5.2MB)
036.NEON-intrinsic其他常用操作-11.mp4 (22.2MB)
037.NEON-intrinsic其他常用操作-12.mp4 (32.02MB)
001.StellarSim_0.mp4 (65.02MB)
002.StellarSim_1.mp4 (16.32MB)
003.StellarSim_2.mp4 (130.11MB)
004.StellarSim_3.mp4 (34.03MB)
005.StellarSim_4.mp4 (32.62MB)
001.一、高性能计算与超级计算机-1.mp4 (41.15MB)
002.一、高性能计算与超级计算机-2.mp4 (43.87MB)
003.一、高性能计算与超级计算机-3.mp4 (31.79MB)
004.一、高性能计算与超级计算机-4.mp4 (23.42MB)
005.一、高性能计算与超级计算机-5.mp4 (34.28MB)
006.二、Linux 常用操作命令-1.mp4 (10.67MB)
007.二、Linux 常用操作命令-2.mp4 (9.87MB)
008.二、Linux 常用操作命令-3.mp4 (15.06MB)
009.二、Linux 常用操作命令-4.mp4 (3.18MB)
010.二、Linux 常用操作命令-5.mp4 (4.79MB)
011.三、编辑器VIM-1.mp4 (4.92MB)
012.三、编辑器VIM-2.mp4 (11.01MB)
013.四、编译器GCC-1.mp4 (5.52MB)
014.四、编译器GCC-2.mp4 (7.24MB)
015.四、编译器GCC-3.mp4 (18.67MB)
016.五、工程构建工具Make-1.mp4 (4.89MB)
017.五、工程构建工具Make-2.mp4 (12.43MB)
018.六、作业管理系统slurm-1.mp4 (9.89MB)
019.六、作业管理系统slurm-2.mp4 (10.42MB)
020.六、作业管理系统slurm-3.mp4 (6.69MB)
021.七、调试器GDB-1.mp4 (18.72MB)
022.七、调试器GDB-2.mp4 (5.04MB)
023.八、传统性能优化-1.mp4 (9.11MB)
024.八、传统性能优化-2.mp4 (3.7MB)
025.八、传统性能优化-3.mp4 (4.47MB)
026.八、传统性能优化-4.mp4 (10.13MB)
027.八、传统性能优化-5.mp4 (9.01MB)
028.八、传统性能优化-6.mp4 (15.9MB)
029.八、传统性能优化-7.mp4 (6.82MB)
030.八、传统性能优化-8.mp4 (5.36MB)
031.八、传统性能优化-9.mp4 (3.07MB)
032.八、传统性能优化-10.mp4 (22.61MB)
033.八、传统性能优化-11.mp4 (25.76MB)
034.八、传统性能优化-12.mp4 (7.61MB)
035.九、高性能算法-1.mp4 (10.92MB)
036.九、高性能算法-2.mp4 (8.97MB)
037.九、高性能算法-3.mp4 (8.76MB)
038.九、高性能算法-4.mp4 (11.15MB)
039.九、高性能算法-5.mp4 (7.91MB)
040.九、高性能算法-6.mp4 (3.87MB)
041.九、高性能算法-7.mp4 (14.3MB)
042.九、高性能算法-8.mp4 (10.4MB)
043.九、高性能算法-9.mp4 (21.55MB)
044.九、高性能算法-10.mp4 (50.59MB)
045.十、程序性能分析-1.mp4 (4.45MB)
046.十、程序性能分析-2.mp4 (12.85MB)
047.十、程序性能分析-3.mp4 (5.41MB)
048.十、程序性能分析-4.mp4 (11.57MB)
049.十、程序性能分析-5.mp4 (4.65MB)
050.十、程序性能分析-6.mp4 (6.2MB)
051.十、程序性能分析-7.mp4 (26.26MB)
052.十、程序性能分析-8.mp4 (16.63MB)