hadoop(一)
Hadoop是一个分布式系统基础架构,现在通常指一个分布式hadoop生态圈,用于海量数据存储与分析计算。
Hadoop 3.x组成
- common
- hdfs
- yarn
- mapreduce
NameNode DateNode Secondary node
- NameNode(nn):存储元数据
- DataNode: 存储文件块数据以及校验和
- Secondary NameNode node(2nn) : 每个一段时间对NameNode进行元数据备份。
yarn
- resource manager
- Node Manager
- applicationMaster
- container 容器
说明: 1.有多个客户端 2. 集群可以运行多个ApplicationMaster 3. 每个NodeManager可以有多个Container(默认1g-8g内存)
hadoop安装
- ip配置与主机名称
hadoop /etc/sysconfig/network-script/ens33 /etc/hostname /etc/hosts
VM
windows - 配置文件/etc/profile
自动配置模块。 - scp -r 拉取/推送两种方式。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 秋叶半金!