大数据测试之hadoop单机环境搭建(超级详细版)


友情提示:本文超级长,请备好瓜子Hadoop的运行模式单机模式是Hadoop的默认模式,在该模式下无需任何守护进程,所有程序都在单个JVM上运行,该模式主要用于开发和调试mapreduce的应用逻辑;伪分布式模式下,Hadoop守护进程运行在一台机器上,模拟一个小规模的集群。该模式在单机模式的基础上增加了代码调试的功能,允许你检查NameNode,DataNode,Jobtracker,Tasktracker等模拟节点的运行情况;单机模式和伪分布式模式均用于开发和调试的目的,真实Hadoop集群的运行采用的是完全分布式模式单机模式安装步骤一个干净的linux基础环境(重要,这个环境如果有问题后续就全是问题了)为了方便大家我已经安装好了一个,大家只需下载导入到vm里即可使用。下载地址:关注公众号测试帮日记】对话框里回复“linux”或者加入QQ群522720170。链接:https://pan.baidu.com/s/1qXRjaK8 密码:xjfk关闭防火墙(适用于centos7,低版本不适用)分别执行如下两条命令:systemctl stop firewalld.servicesystemctl disable firewalld.service修改host namevi /etc/hosts然后把自己虚机的名字追加到两行的末尾,如果用的是我们提供的虚机,名字就是linux,追加之后的效果如图重启网络:/etc/rc.d/init.d/network restart设置无密码登录(用于hadoop启动)cd ~ #进入当前用户的目录mkdir -p /root/.ssh #我们用的root用户cd ~/.ssh/ssh-keygen -t rsa #如有提示,直接按回车 cat id_rsa.pub >> authorized_keys # 香港云主机加入授权安装jdk1.8并配置环境变量tar解压cp解压后的包到/usr/lib/java/(如果没有java目录就创建一下)vi /etc/profile,末尾添加如下内容:export JAVA_HOME=/usr/lib/java/jdk1.8.0_11export JRE_HOME=/usr/lib/java/jdk1.8.0_11/jreexport PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATHexport CLASSPATH=$CLASSPATH:.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib执行source /etc/profile使得环境变量生效验证是否成功,如下图安装hadoop2.7.4tar解压cp解压后的包到/usr/lib/hadoop/(如果没有hadoop目录就创建一下)设置hadoop-env.shvi /usr/lib/hadoop/hadoop-2.7.4/etc/hadoop/hadoop-env.sh找到# The java implementation to use.这句话,在下面添加如下内容:#export JAVA_HOME=${JAVA_HOME}export JAVA_HOME=/usr/lib/java/jdk1.8.0_11export HADOOP_HOME=/usr/lib/hadoop/hadoop-2.7.4export PATH=$PATH:/usr/lib/hadoop/hadoop-2.7.4/binexport HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop执行source /usr/lib/hadoop/hadoop-2.7.4/etc/hadoop/hadoop-env.sh,使得环境变量生效验证是否成功,如下图配置相关的xml文件vi /usr/lib/hadoop/hadoop-2.7.4/etc/hadoop/core-site.xml(hadoop全局配置)内容如下:fs.defaultFShdfs://127.0.0.1:9000vi /usr/lib/hadoop/hadoop-2.7.4/etc/hadoop/hdfs-site.xml(hdfs配置)内容如下:dfs.replication1cd /usr/lib/hadoop/hadoop-2.7.4/etc/hadoopcp mapred-site.xml.template mapred-site.xmlvi mapred-site.xml(MapReduce的配置)内容如下:mapreduce.framework.nameyarnvi yarn-site.xml(yarn配置)内容如下:yarn.nodemanager.aux-servicesmapreduce_shuffle格式化hdfs文件系统初次运行hadoop时一定要有该操作,命令如下:/usr/lib/hadoop/hadoop-2.7.4/bin/hadoop namenode -format执行期间可能需要确认是否继续,如果有,就输入y回车即可当你看到如下的内容时证明成功了如果看到的是exiting with status 1,那么请运行如下命令,之后在进行hdfs的格式化mkdir -pv /tmp/hadoop-root/dfs/name启动hadoop(hdfs和yarn)sh /usr/lib/hadoop/hadoop-2.7.4/sbin/start-all.shsh /usr/lib/hadoop/hadoop-2.7.4/sbin/stop-all.sh #停止如果没有报错说明就成功了使用jps命令查看进程,如果出现下面的内容就说明确定以及肯定成功啦PS:如果修改了上面的xml文件需要重启服务哦使用web查看Hadoop运行状态http://你的服务器ip地址:50070/使用web查看集群状态http://你的服务器IP地址:8088可能会遇到的问题如果你多次进行了hdfs的格式化操作,可能会无法启动datanode,原因是id不一致,一般的解决方法为将namenode clusterID和datanode clusterID改成一样的就行了。修改的文件为/tmp/hadoop-root/dfs/下的name or data文件下的VERSION里的内容

相关推荐: JavaScript怎么实现订单操作小程序

这篇文章主要介绍了JavaScript怎么实现订单操作小程序的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇JavaScript怎么实现订单操作小程序文章都会有所收获,下面我们一起来看看吧。具体代码如下关于“JavaScript怎么…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 07/24 10:57
下一篇 07/24 11:01

相关推荐