Apache Spark的设计与实现 中文PDF版
基本信息
打开支付宝首页搜“673273051”领红包,领到大红包的小伙伴赶紧使用哦!
相关书籍
内容介绍
本文主要讨论 Apache Spark的设计与实现,重点关注其设计思想、运行原理、实现架构及性能调优,附带讨论与 Hadoop MapReduce 在设计与实现上的区别。不喜欢将该文档称之为“源码分析”,因为本文的主要目的不是去解读实现代码,而是尽量有逻辑地,从设计与实现原理的角度,来理解 job 从产生到执行完成的整个过程,进而去理解整个系统。
目录:
1. 介紹
2. 总体介绍
3. Job逻辑执行图
4. Job物理执行图
5. Shuffle过程
6. 统模块如何协调完成整个Job
7. Cache和Checkpoint功能
8. Broadcast功能

下载地址
打赏