1.大数据概述
2.Hadoop及Hadoop生态圈
3.生态组件应用案例
4.Hadoop版本及部署模式
5.环境准备及hadoop解压安装
6.hadoop核心配置
7.格式化及启动测试
1.HDFS概述
2.HDFS架构
3.HDFSShell操作介绍及目录操作
4.HDFSShell文件操作(一)
5.HDFSShell文件操作(二)
6.HDFSShell帮助
7.HDFS-JAVA-API介绍
8.JAVA-API创建文件
9.JAVA-API目录操作
10.JAVA-API上传下载
11.JAVA-API其他
12.HDFS数据读写流程
13.HDFS副本机制
14.HDFS机架感知&负载均衡
15.HDFS序列化概述
16.HDFS序列化案例
1.MapReuce概述
2.MapReduce执行流程及WordCount代码分析
3.WordCount执行流程详解
4.MapReduce编程基础
5.MapReduce编程步骤
6.MapReduce案例
7.MapReduce错误处理
1.Shuffle机制概述
2.Combiner概述
3.Combiner案例
4.Partitioner案例
5.Join案例(一)
6.Join案例(二)
7.Join案例(三)
8.排序
9.二次排序(一)
10.二次排序(二)
11.MapReduce工作机制及YARN平台介绍(一).6472.10288
11.MapReduce工作机制及YARN平台介绍(一)
12.MapReduce工作机制及YARN平台介绍(二)
1.Zookeeper概述
2.zookeeper部署
3.zookeeper基本操作
4.HDFS-HA机制
5.集群规划及核心配置
6.HDFS-HA集群部署(一)
7.HDFS-HA集群搭建(二)
8.HDFS-Fedration&Snapshots
9.YARN-HA
1.HBase概述
9.HBase-API操作(一)
10.HBase-API操作(二)
2.HBase架构及物理模型
3.HBase数据模型
4.HBase部署模式
5.HBase伪分布式安装部署
6.HBase-Shell命令介绍
7.HBase-Shell操作
8.HBase-Java-API介绍
1.Hive概述
2.Hive架构
3.Hive部署模式
4.Hive本地部署
5.Hive数据模型
6.DDL&DML操作命令
7.DDL&DML案例(一)
8.DDL&DML案例(二)
9.DDL&DML案例(三)
10.HiveShell&参数配置&自定义函数
11.Hive自定义函数案例
12.Hive优化策略
1.Sqoop概述及架构
2.Sqoop安装部署
3.Sqoop常用命令及参数
4.Sqoop导入案例(一)
5.Sqoop导入案例(二)
6.Sqoop导入案例(三)
7.Sqoop导出案例
8.Sqoop导入Hive
9.工作流调度器概述
10.Azkaban案例(一)
11.Azkaban案例(二)
分布式计算与Hadoop
扫描二维码查看
MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",和它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。
学习目标:
掌握MapReduce的原理并灵活运用。
学习建议:
懂得原理,后续的开发就容易了,所以对于MapReduce的开发原理一定要弄清楚。多思考多翻阅资料。
山东泉霖教育科技有限公司
暂无联系方式
激活
选择学校
注册
忘记密码