作 者:杨磊 著
定 价:59
出 版 社:机械工业出版社
出版日期:2017年04月01日
页 数:242
装 帧:平装
ISBN:9787111563327
●第1章Spark架构与集群环境
●1.1Spark概述与架构
●1.1.1Spark概述
●1.1.2Spark生态
●1.1.3Spark架构
●1.2在Linux集群上部署Spark
●1.2.1安装OpenJDK
●1.2.2安装Scala
●1.2.3配置SSH免密码登录
●1.2.4Hadoop的安装配置
●1.2.5Spark的安装部署
●1.2.6Hadoop与Spark的集群复制
●1.3Spark 集群试运行
●1.4Intellij IDEA的安装与配置
●1.4.1Intellij的安装
●1.4.2Intellij的配置
●1.5Eclipse IDE的安装与配置
●1.6使用Spark Shell开发运行Spark程序
●1.7本章小结
●第2章Spark 编程模型
●部分目录
这是一本引导读者深度学习Spark的技术指南。它由靠前具实力的大数据在线教育机构小象学院组织撰写,旨在用合理的结构和精炼的内容让读者用短的时间掌握Spark技术的核心内容。靠前章和第2章分别讲解了Spark的开发环境和编程模型;第3章分析了Spark的工作机制和原理;第4章则结合源代码分析了Spark的内核架构和实现原理;第5章讲解了Spark与YARN的结合应用;第6章介绍了Spark生态中其他模块的功能和使用;第7章总结了Spark性能调优方面的技巧和方法;第8章描述了Spark2.0发布后,其模块API的变化以及新增的功能特性。
Preface?前 言Spark诞生于美国加州大学伯克利分校AMP实验室。随着大数据技术在互联网、金融等领域的突破式进展,Spark在近些年得到更为广泛的应用。这是一个核心贡献者超过一半为华人的大数据平台开源项目,且正处于飞速发展、快速成熟的阶段。 为什么写这本书Spark已经成为大数据计算、分析领域新的热点和发展方向。相对于Hadoop传统的MapReduce计算模型,Spark提供更为高效的计算框架以及更为丰富的功能,因此在大数据生产应用领域中不断攻城略地,势如破竹。 与企业不断涌现的对大数据技术的需求相比,大数据人才还存在很大缺口,对大数据技术充满期许的新人正在源源不断地加入这个领域。在小象学院的教学实践过程中,我们发现,一本能完整系统地介绍Spa等