spark最佳实践pdf是由陈欢和林世飞着作的一部spark教程,这部电子书通过实际案例全面解读了spark大数据应用设计,内容丰富全面,通俗易懂,对于大数据开发人员来说非常的实用,欢迎大家来绿色资源网下载学习!
Spark最佳实践电子书介绍《Spark最佳实践》是2016年人民邮电出版社出版的图书,作者是陈欢和林世飞。本书是Spark实战指南,全书共分8章。前4章介绍Spark的部署、工作机制和内核,后4章分别通过实战项目介绍Spark SQL、Spark Streaming、Spark GraphX和Spark MLib功能模块。此外,本书详细介绍了常见的实战问题,比如大数据环境下的配置设置、程序调优等。本书附带的一键安装脚本,更能为初学者提供很大帮助。
第1 章 Spark 与大数据 1
第2 章 Spark 基础 8
第3 章 Spark 工作机制 58
第4 章 Spark 内核讲解 77
第5 章 Spark SQL 与数据仓库 92
第6 章 Spark 流式计算 122
第7 章 Spark 图计算 149
第8 章 Spark MLlib 169
附录 Scala 语言参考 197
作者简介陈欢,腾讯杰出程序员,15年编码经验,曾任职网络安全、互联网金融等部门,亲手从零建设了财付通业务的Spark集群,并使之同时支持SQL、实时计算、机器学习等多种数据计算场景。他目前就职于腾讯社交与效果广告部,从事大数据分析工作。
林世飞,腾讯杰出研究员,2005年加入腾讯,先后在无线产品、安全中心、搜索平台、开放平台、社交与效果广告部等部门从事开发和团队管理工作。他对网络安全、搜索引擎、数据挖掘、机器学习有一定了解,热衷知识传播和分享,曾获腾讯学院2009年年度杰出讲师。目前,他就职于社交与效果广告部,负责广告系统相关的研发工作。