Spark性能调优实战

课前必学 (3讲)



开篇词 | Spark性能调优，你该掌握这些“套路”

时长 11:05

01 | 性能调优的必要性：Spark本身就很快，为啥还需要我调优？

时长 12:48

02 | 性能调优的本质：调优的手段五花八门，该从哪里入手？

时长 14:05

原理篇 (5讲)



03 | RDD：为什么你必须要理解弹性分布式数据集？

时长 15:25

04 | DAG与流水线：到底啥叫“内存计算”？

时长 16:18

05 | 调度系统：“数据不动代码动”到底是什么意思？

时长 25:11

06 | 存储系统：空间换时间，还是时间换空间？

时长 19:18

07 | 内存管理基础：Spark如何高效利用有限的内存空间？

时长 20:11

通用性能调优篇 (12讲)



08 | 应用开发三原则：如何拓展自己的开发边界？

时长 23:49

09 | 调优一筹莫展，配置项速查手册让你事半功倍！（上）

时长 24:30

10 | 调优一筹莫展，配置项速查手册让你事半功倍！（下）

时长 20:04

11 | 为什么说Shuffle是一时无两的性能杀手？

时长 21:05

12 | 广播变量（一）：克制Shuffle，如何一招制胜！

时长 15:44

13 | 广播变量（二）：如何让Spark SQL选择Broadcast Joins？

时长 16:04

14 | CPU视角：如何高效地利用CPU？

时长 22:26

15 | 内存视角（一）：如何最大化内存的使用效率？

时长 18:26

16 | 内存视角（二）：如何有效避免Cache滥用？

时长 23:05

17 | 内存视角（三）：OOM都是谁的锅？怎么破？

时长 17:42

18 | 磁盘视角：如果内存无限大，磁盘还有用武之地吗？

时长 16:29

19 | 网络视角：如何有效降低网络开销？

时长 15:43

Spark SQL 性能调优篇 (12讲)



20 | RDD和DataFrame：既生瑜，何生亮？

时长 15:41

21 | Catalyst逻辑计划：你的SQL语句是怎么被优化的？（上）

时长 18:32

22 | Catalyst物理计划：你的SQL语句是怎么被优化的（下）？

时长 17:33

23 | 钨丝计划：Tungsten给开发者带来了哪些福报？

时长 21:46

24 | Spark 3.0（一）：AQE的3个特性怎么才能用好？

时长 18:35

25 | Spark 3.0（二）：DPP特性该怎么用？

时长 13:50

26 | Join Hints指南：不同场景下，如何选择Join策略？

时长 19:28

27 | 大表Join小表：广播变量容不下小表怎么办？

时长 21:04

28 | 大表Join大表（一）：什么是“分而治之”的调优思路？

时长 15:31

29 | 大表Join大表（二）：什么是负隅顽抗的调优思路？

时长 17:33

30｜应用开发：北京市小客车（汽油车）摇号趋势分析

时长 19:10

31 | 性能调优：手把手带你提升应用的执行性能

时长 27:39

特别放送 (2讲)



Spark UI（上）| 深入解读Spark作业的“体检报告”

时长 01:28

Spark UI（下）：深入解读Spark作业的“体检报告”

时长 01:11

结束语 (2讲)



期末考试 | “Spark性能调优”100分试卷等你来挑战！

时长 00:45

结束语 | 在时间面前，做一个笃定学习的人
隐藏内容
此处内容需要权限查看
普通用户购买价格：1金币
会员用户购买价格：免费
永久会员用户购买价格：免费推荐
会员免费查看

时长 11:54

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。