本书以项目实战为核心载体,采用任务驱动教学模式,系统且深入地解析Hadoop生态圈中主流的大数据开发技术。全书精心编排 7个项目,从Hadoop的基础理论入门,逐步深入到Hadoop集群环境配置、Hadoop分布式文件系统、MapReduce分布式计算框架,再到 MapReduce离线数据处理、基于Hive的离线数据分析,最后以综合项目实战,构建起完整的知识体系。书中提供了详细且易操作的步骤指引,即便是零基础的读者,也能通过练习,顺利搭建稳定的Hadoop集群,并独立完成复杂的项目开发。本书兼具通俗易懂的语言表达与丰富实用的技术细节的特点,不仅是大数据开发初学者夯实基础的“入门宝典”,也是大数据运维人员优化技能、大数据分析与挖掘从业者提升实战能力的“进阶指南”。此外,本书可作为培训机构的专业培训教材,以及高等院校大数据技术专业课程的优质教学用书,可助力培养理论与实践统一的大数据专业人才。