课前必学 (3讲)
开篇词 | Spark性能调优,你该掌握这些“套路”
时长 11:05
01 | 性能调优的必要性:Spark本身就很快,为啥还需要我调优?
时长 12:48
02 | 性能调优的本质:调优的手段五花八门,该从哪里入手?
时长 14:05
原理篇 (5讲)
03 | RDD:为什么你必须要理解弹性分布式数据集?
时长 15:25
04 | DAG与流水线:到底啥叫“内存计算”?
时长 16:18
05 | 调度系统:“数据不动代码动”到底是什么意思?
时长 25:11
06 | 存储系统:空间换时间,还是时间换空间?
时长 19:18
07 | 内存管理基础:Spark如何高效利用有限的内存空间?
时长 20:11
通用性能调优篇 (12讲)
08 | 应用开发三原则:如何拓展自己的开发边界?
时长 23:49
09 | 调优一筹莫展,配置项速查手册让你事半功倍!(上)
时长 24:30
10 | 调优一筹莫展,配置项速查手册让你事半功倍!(下)
时长 20:04
11 | 为什么说Shuffle是一时无两的性能杀手?
时长 21:05
12 | 广播变量(一):克制Shuffle,如何一招制胜!
时长 15:44
13 | 广播变量(二):如何让Spark SQL选择Broadcast Joins?
时长 16:04
14 | CPU视角:如何高效地利用CPU?
时长 22:26
15 | 内存视角(一):如何最大化内存的使用效率?
时长 18:26
16 | 内存视角(二):如何有效避免Cache滥用?
时长 23:05
17 | 内存视角(三):OOM都是谁的锅?怎么破?
时长 17:42
18 | 磁盘视角:如果内存无限大,磁盘还有用武之地吗?
时长 16:29
19 | 网络视角:如何有效降低网络开销?
时长 15:43
Spark SQL 性能调优篇 (12讲)
20 | RDD和DataFrame:既生瑜,何生亮?
时长 15:41
21 | Catalyst逻辑计划:你的SQL语句是怎么被优化的?(上)
时长 18:32
22 | Catalyst物理计划:你的SQL语句是怎么被优化的(下)?
时长 17:33
23 | 钨丝计划:Tungsten给开发者带来了哪些福报?
时长 21:46
24 | Spark 3.0(一):AQE的3个特性怎么才能用好?
时长 18:35
25 | Spark 3.0(二):DPP特性该怎么用?
时长 13:50
26 | Join Hints指南:不同场景下,如何选择Join策略?
时长 19:28
27 | 大表Join小表:广播变量容不下小表怎么办?
时长 21:04
28 | 大表Join大表(一):什么是“分而治之”的调优思路?
时长 15:31
29 | 大表Join大表(二):什么是负隅顽抗的调优思路?
时长 17:33
30|应用开发:北京市小客车(汽油车)摇号趋势分析
时长 19:10
31 | 性能调优:手把手带你提升应用的执行性能
时长 27:39
特别放送 (2讲)
Spark UI(上)| 深入解读Spark作业的“体检报告”
时长 01:28
Spark UI(下):深入解读Spark作业的“体检报告”
时长 01:11
结束语 (2讲)
期末考试 | “Spark性能调优”100分试卷等你来挑战!
时长 00:45
结束语 | 在时间面前,做一个笃定学习的人 隐藏内容此处内容需要权限查看
会员免费查看
隐藏内容
此处内容需要权限查看
会员免费查看时长 11:54
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。