纵有疾风起
人生不言弃

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)

Hadoop也可以运行在一个伪分布模式,每个Hadoop守护进程运行在一个单独的Java程序的一个节点。

伪分布模式需要在单机模式基础上进行配置。

在/software/hadoop/etc/hadoop/ 目录下
core-site.xml,hdfs-site.xml,mapred-site.xml,yarn-site.xml等文件。
下面对以上文件进行配置。

一、etc/hadoop/core-site.xml
包含了hadoop启动时的配置信息。

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图1

二、etc/hadoop/hdfs-site.xml
用来配置集群中每台主机都可用,指定主机上作为namenode和datanode的目录。

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图2

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图3

三、etc/hadoop/mapred-site.xml
默认情况下,/usr/local/hadoop/etc/hadoop/文件夹下有mapred.xml.template文件,我们要复制该文件,并命名为mapred.xml,该文件用于指定MapReduce使用的框架

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图4

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图5

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图6

四、etc/hadoop/yarn-site.xml
包含了MapReduce启动时的配置信息。

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图7

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图8

五、格式化hdfs

 hdfs namenode -format    

只需要执行一次即可,如果在hadoop已经使用后再次执行,会清除掉hdfs上的所有数据。
Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图9

六、启动Hadoop
经过上文所描述配置和操作后,下面就可以启动这个单节点的集群
执行启动命令:

 sbin/start-dfs.sh 

执行该命令时,如果有yes /no提示,输入yes回车即可。
Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图10
接下来,执行:

sbin/start-yarn.sh 

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图11

执行完这两个命令后,Hadoop会启动并运行。
执行 jps命令,会看到Hadoop相关的进程。

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图12

浏览器打开 http://localhost:50070/,会看到hdfs管理页面。

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图13

浏览器打开 http://localhost:8088,会看到hadoop进程管理页面。

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图14

七、WordCount验证
dfs上创建input目录

bin/hadoop fs -mkdir -p input

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图15

把hadoop目录下的README.txt拷贝到dfs新建的input里

hadoop fs -copyFromLocal README.txt input

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图16

运行WordCount

hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.5.2-sources.jar org.apache.hadoop.examples.WordCount input output

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图17
执行过程:

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图18

运行完毕后,查看单词统计结果

hadoop fs -cat output/*

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)插图19

原文链接:https://blog.csdn.net/scgaliguodong123_/article/details/44416565

本站声明:网站内容来源于网络,如有侵权,请联系我们,我们将及时处理。

未经允许不得转载:起风网 » Ubuntu14.04安装Hadoop2.5.2(伪分布模式)
分享到: 生成海报

评论 抢沙发

评论前必须登录!

立即登录