前提:搭建zookeeper集群、java环境、无秘互通
注意:文中加粗部分表示需要按实际情况修改的部分zookeeper可以参考:zookeeper传送门下载安装包https://mirrors.tuna.tsinghua.edu.cn/apache/ 是官网提供的安装包下载网站之一。结构服务简介:
zo 香港云主机okeeper:分布式应用程序协调服务。
namenode:管理服务。管理元数据,维护目录树,响应请求。
datanode:hadoop中存储数据。
journalnode:实现namenode数据共享,保持数据的一致性。
ResourceManager:yarn集群中资源的统一管理和分配
nodemanager:ResourceManager在每台机器上的代理
参考文档:hadoop介绍
注:zookeeper和hadoop可以不装在一个台机器上,只需配置文件指定即可检查java环境
java -version
如果能够显示版本说明jdk安装ok#下载文件(可能因为版本更新生效)
cd /tmp
wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.5/hadoop-2.7.5.tar.gz
#解压文件
tar axf hadoop-2.7.5/hadoop-2.7.5.tar.gz -C /usr/local
#重命名,方便管理配置
cd /usr/local
rename hadoop-2.7.5 hadoop hadoop-2.7.5
#修改环境变量
vim /etc/profile
在文件最后添加如下内容export HADOOP_HOME=/usr/local/hadoop
export PATH=${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:${PATH}
export HADOOP_MAPARED_HOME=${HADOOP_HOME}
export HADOOP_COMMON_HOME=${HADOOP_HOME}
export HADOOP_HDFS_HOME=${HADOOP_HOME}
export HADOOP_YARN_HOME=${HADOOP_HOME}
export YARN_HOME=${HADOOP_HOME}
export YARN_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export HDFS_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export LD_LIBRARY_PATH=${HADOOP_HOME}/lib/native/:${LD_LIBRARY_PATH}
export HADOOP_COMMON_LIB_NATIVE_DIR=${HADOOP_HOME}/lib/native
export HADOOP_OPTS=”-Djava.library.path=${HADOOP_HOME}/lib/native”#使其生效
source /etc/profile
#创建文件存放目录
mkdir -p /usr/local/hadoop/{name,data,tmp,journal}
#修改配置文件
cd $HADOOP_HOME/etc/hadoop
#修改slaves文件,指定slave服务器
vim slavesstudy
centos156
client#修改core-site.xml,指定hdfs集群,临时文件目录,zookeeper等
vim core-site.xml
MapReduce详解vim yarn-site.xml
vim hadoop-env.shexport JAVA_HOME=/usr/local/jdk注意 export HADOOP_SSH_OPTS是自动hadoop服务ssh使用端口,如果你没有使用默认的22号端口,请修改该选项,否则HA无法实现vim yarn-env.shJAVA_HOME=/usr/local/jdk#将study节点上的hadoop文件拷贝到centos156的/usr/local目录下
scp -r study:/usr/local/hadoop /usr/local
#修改环境变量
scp -r study:/etc/profile /etc/
source /etc/profile
#如果你使用的是其他的用户执行hadoop,就需要修改hadoop文件的属主等信息#与 主节点二-centos156操作一样
scp -r study:/usr/local/hadoop /usr/local
scp -r study:/etc/profile /etc/
source /etc/profile第一次运行hadoop是需要格式化数据,启动会比较麻烦,之后的启动只需要start-all.sh停止stop-all.sh前提:zookeeper状态正常,jdk状态正常,环境变量设置正常#创建命名空间
hdfs zkfc -formatZK
#启动journalnode
hadoop-daemon.sh start journalnode(最好三个节点一起启动)
#格式化namenode
hdfs namenode -format hadoop
#启动namenode
hadoop-daemon.sh start namenode
#启动zfkc
hadoop-daemon.sh start zkfc#启动journalnode
hadoop-daemon.sh start journalnode
#从hdfs namenode -bootstrapStandby获取格式化后的元数据
hdfs namenode -bootstrapStandby
#启动namenode
hadoop-daemon.sh start namenode
#启动zfkc
hadoop-daemon.sh start zkfc#启动journalnode
hadoop-daemon.sh start journalnode上面三个节点命令运行完成后重启hadoop集群
关闭集群stop-all.sh启动集群start-all.sh访问状态页面
http://192.168.233.155:50070/dfshealth.html#tab-overview
http://192.168.233.156:50070/dfshealth.html#tab-overview
页面上的datanodes可以看到datanode的状态,utilities可以查看文件和日志hadoop常用命令
关闭集群 stop-all.sh
启动集群 start-all.sh
单独启动namenode hadoop-daemon.sh start namenode
单独启动datanode hadoop-daemon.sh start datanode
单独启动journalnode hadoop-daemon.sh start journalnode
单独启动zkfc hadoop-daemon.sh start zkfc
手动转移活动namenode hdfs haadmin -transitionToActive –forcemanual study查看/下面的文件 hadoop fs -ls /
上传文件到hadoop hadoop fs -put
i.e. hadoop fs -put /etc/passwd /
hadoop中创建命令 hadoop fs –mkdir
i.e. hadoop fs -mkdir /tmp
创建空文件 hadoop fs -touchz
i.e. hadoop fs -touchz /tmp/hello
查看文件 hadoop fs -cat
i.e. hadoop fs -cat /passwd
移动或重命名 hadoop fs -mv
下载hadoop中的文件或目录到本地
hadoop fs -get
i.e. hadoop fs -get /passwd /tmp
修改文件权限 hadoop fs -chmod [-R]
i.e. hadoop fs -chmod 777 /passwd
删除文件 hadoop fs -rm
删除目录 hadoop fs -rm -r mkdir /tmp/hadoop
chmod 777 /tmp/hadoop
hadoop fs -copyToLocal hdfs://study:9000/ /tmp/hadoop数据恢复
先用u盘或者其他的任何方式将文件传输到目标机器hadoop fs -copyFromLocal /tmp/hadoop hdfs://study:9000/
hadoop fs -ls /
master: Host key verification failed.
请检查authorized_keys 和known_hosts文件是是否有该主机的信息,ssh 主机名能不能连上hadoop集群一个主节点namenode挂掉之后启动异常
2018-01-17 08:53:24,751 FATAL [hadoop1:16000.activeMasterManager] master.HMaster: Failed to become active master
org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.ipc.StandbyException): Operation category READ is not supported in state standby
at org.apache.hadoop.hdfs.server.namenode.ha.StandbyState.checkOperation(StandbyState.java:87)
at org.apache.hadoop.hdfs.server.namenode.NameNode$NameNodeHAContext.checkOperation(NameNode.java:1774)
at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.checkOperation(FSNamesystem.java:1313)
at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.getFileInfo(FSNamesystem.java:3850)
at org.apache.hadoop.hdfs.server.namenode.NameNodeRpcServer.getFileInfo(NameNodeRpcServer.java:1011)
at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolServerSideTranslatorPB.getFileInfo(ClientNamenodeProtocolServerSideTranslatorPB.java:843)
at org.apache.hadoop.hdfs.protocol.proto.ClientNamenodeProtocolProtos$ClientNamenodeProtocol$2.callBlockingMethod(ClientNamenodeProtocolProtos.java)处理过程:
查看状态(看web页面)发现study的状态为standby,centos156状态为active
如果有一个active这集群状态依然是正常的,如果两个都是standby则为异常。状态不正常可能是数据异常造成的,namenode挂的时间长了数据不同步,处理方法一、从centos 156节点将数据同步过来,方法二、删除所有节点上所有hadoop的数据,删除zk中hadoop-ha目录
本次使用的是方法二
所有节点删除${HADOOP_HOME}下name、data、logs、tmp目录下的所有文件
删除zk中的数据
zkCli.sh
ls /
rmr /hadoop-ha
quit
重新生成数据
主节点1-study
#创建命名空间
hdfs zkfc -formatZK
#启动journalnode
hadoop-daemon.sh start journalnode(最好三个节点一起启动)
#格式化namenode
hdfs namenode -format hadoop
#启动namenode
hadoop-daemon.sh start namenode
#启动zfkc
hadoop-daemon.sh start zkfc
主节点二-centos156
#启动journalnode
hadoop-daemon.sh start journalnode
#从hdfs namenode -bootstrapStandby获取格式化后的元数据
hdfs namenode -bootstrapStandby
#启动namenode
hadoop-daemon.sh start namenode
#启动zfkc
hadoop-daemon.sh start zkfc从节点-client
#启动journalnode
hadoop-daemon.sh start journalnode查看状态肯定是active,都是新的了hadoop介绍
配置文件参考文档
webhdfs详解
hadoop HDFS常用文件操作命令
hadoop fs管理文件权限:https://www.cnblogs.com/linn/p/5526071.html
小编给大家分享一下如何修改win7权限为最高管理员权限,相信大部分人都还不 香港云主机怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!方法/步骤:方法一:1.右键选中“计算机”中的“管理”进入,在打开的管…
免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。