本篇内容主要讲解“hadoop0.20.2集群搭建Ubuntu14.04环境的方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“hadoop0.20.2集群搭建Ubuntu14.04环境的方法”吧!配前准备一. 安装环境:Ubuntu 14.04 ———一共三台机器其中一台namenode+jobtracker (master) , 两台 datanode + tasktracker(hadoop, salve1)下表为各个机器的具体内容ip username/password hostname10.60.38.165 hadoop/123456 hadoop
10.60.38.166 hadoop/123456 master
10.60.38.155 hadoop/123456 salve1 (……居然拼错了,我靠)
在每台机器的/etc/hosts 下面 添加10.60.38.165 hadoop10.60.38.166 master10.60.38.155 salve1使得各台机器相互之间可以ping通(通过hostname可以ping)(ps: /etc/hosts 里面的数据全部清空,只留上面的三个 以及第一项: 127.0.0.1 localhost )二. SSH 无密码验证配置1.因为大部分Linux里面默认已经安装好了ssh,我在安装时已经默认安装好,但是ssh service 没有安装,使用 sudo apt-get install openssh-server 来安装 ssh service。(确保 22端口号处于监听状态:netstat -nat 查看)2.在每台机器上都执行 下面命令: ssh-kengen -t rsa -P “”一路enter (将密钥的位置保存在默认的路径下)在user的当前目录下出现目录/.ssh(默认的权限为700)里面生成两个文件 id_rsa 和 id_rsa.pub3.接着在 Master 节点上做如下配置把id_rsa.pub 追加到授权的key 里面cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys 4.下面在其他两台机器上依次执行命令将各自生成的id_rsa.pub 添加到Master 下的authorized_keys 里面cat id_rsa.pub | sshhadoop@master “cat >> ~/.ssh/authorized_keys ( 此时 ssh 到 另外一台机器上 需要另外一台机器的密码)5.最后将Master 机器上得到的 authorized_keys 依次添加到 各台机器的 /home/hadoop/.ssh 目录下scp authorized_keys hadoop@hadoop :~/.sshscp authorized_keys hadoop@salve1:~/.ssh6.配置完成后在每一台机器上都可以无密码验证登录另外一台机器了。于是这一步搞定。在每台机器上安装jdk 和 Hadoop配置Hadoop (此处我的版本为hadoop0.20.2,jdk1.7)—-在配置文件中设值时,两边千万不能有空格,不然无效。接下来配置配置文件:hadoop-env.sh, core-site.xml, hdfs-site.xml, mapred-site.xmlPS:对于hadoop-env.sh 各个节点的配置都是相同的。对于master节点,需要额外配置slaves 文件,在里面添加各个datanode 的ip 地址下面附上master节点与Hadoop节点的配置(salve1与Hadoop类似,只需修改对于的ip,这里我已经大部分采用系统默认配置,所以无需更改)hadoop-env.sh:export JAVA_HOME=/opt/jdk1.7(就在最后面加上即可)core-site.xml:
经过以下几步:1.create some files(file01.txt, file02.txt)2.hadoop fs -mkdir input3.hadoop fs -put file*.txt input4.hadoop jar /opt/hadoop/hadoop-0.20.2-examples.jar wordcount input output5.hadoop fs -ls output开发云主机域名6.hadoop fs -cat output/part-r-00000最得到结果:
;slkdfj 1aer 1apple 1are 1asfjjjf 1c++ 1fj 1hello 2java 3tantairs 1world 4到此,相信大家对“hadoop0.20.2集群搭建Ubuntu14.04环境的方法”有了更深的了解,不妨来实际操作一番吧!这里是开发云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
本文小编为大家详细介绍“count(1)比count(*)快吗”,内容详细,步骤清晰,细节处理妥当,希望这篇“count(1)比count(*)快吗”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。在某些时候,count(1) 比 co…
免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。