hadoop伪分布式的安装方法

这篇文章主要介绍“hadoop伪分布式的安装方法”,在日常操作中,相信很多人在hadoop伪分布式的安装方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”hadoop伪分布式的安装方法”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

十余年的开福网站建设经验,针对设计、前端、开发、售后、文案、推广等六对一服务,响应快,48小时及时工作处理。成都全网营销推广的优势是能够根据用户设备显示端的尺寸不同,自动调整开福建站的显示方式,使网站能够适用不同显示终端,在浏览器中调整网站的宽度,无论在任何一种浏览器上浏览网站,都能展现优雅布局与设计,从而大程度地提升浏览体验。创新互联从事“开福网站设计”,“开福网站推广”以来,每个客户项目都认真落实执行。

    hadoop伪分布式一般用于学习和测试.生产环境一般不使用.

    (如有错误,欢迎批评指正)

    1.安装环境

        在windows系统上安装linux系统,以CenOS为例.hadoop版本是hadoop1.1.2

    2.配置linux虚拟机

        2.1确保window的上的网卡WMnet1和Linux虚拟机的网卡在同一网段(ping一下试试,确保可以ping通即可)

        2.2修改主机名

            最好修改一下(统一管理,方便好记).指令:vim /etc/sysconfig/network

        2.3修改ip

            对linux指令不熟悉的同学最好使用图形化界面来改(建议)

            指令:vim /etc/sysconfig/network-scripts/ifcfg-eth0(每个人机器

                不同,虚拟机上的网卡有可能不一样,改成自己机器上网卡)

            修改ipaddress,netmask,gateway.

        2.4修改主机名与ip的映射关系

            指令:vim /etc/hosts

        2.5关闭防火墙(关闭开机启动)

            指令:chkconfig iptables off

        2.6重启linux

            指令:reboot

    3.安装jdk

        3.1上传jdk

        3.2添加执行权限

            指令:chmod u+x jdk(自己上传的jdk)

        3.3解压

            解压到指定目录(请所有的文件统一管理)

            指令:tar -zxvf jdk(自己上传的jdk) -C 指定目录

        3.4添加环境变量

            指令:vim /etc/profile

        3.5刷新(使配置的环境变量生效)

            指令:source /etc/profile

    4.安装hadoop伪分布式

        4.1上传hadoop

        4.2确保有执行权限,并解压(再次强调,文件最好统一管理)

            指令:tar -zxvf hadoop(上传的hadoop版本) -C 指定目录

        4.3配置hadoop(修改4个配置文件),进入到hadoop-1.1.2/conf目录下

            如果对指令不熟悉(请使用工具修改,例如:Notepad++等)

            4.31hadoop-env.sh

                在第九行,去掉注释,配置JAVA_HOME

            4.32core-site.xml

                

                   

                    

                        fs.default.name

                        hdfs://配置的主机名:9000

                    

                    

                    

                        hadoop.tmp.dir

                        /../hadoop-1.1.2/tmp

                    

                

            4.33hdfs-site.xml

                

                

                    

                        dfs.replication

                        1

                        

                    

                

            4.34mapred-site.xml

                

                

                    

                        mapred.job.tracker

                        配置的主机名:9001

                    

                

            4.4添加hadoop环境变量

                指令:vim /etc/profile

            4.5格式化hadoop的hdfs

                指令:hadoop namenode -format

            4.6启动hadoop

                指令:start-all.sh

            4.7验证hadoop是否启动成功

                指令:jps

                成功了会出现下面五个

                    NameNode

                    SecondaryNameNode

                    DataNode

                    JobTracker

                    TaskTracker

                还可以通过浏览器验证

                    http://linux的ip:50070(hdfs管理界面)

                    http://linux的ip:50030(mapreduce管理界面)

                    但是必须先在windows系统下  

              C:\Windows\System32\drivers\etc 添加linux主机名和ip的映射关系

            5.配置ssh免登陆

                ssh是secure shell

                生成ssh密钥指令:ssh-keygen -t rsa连续按回车(4次)即可

                在/root下有隐藏文件.ssh, 进入到/root/.ssh/下,多了2个

                文件(id_rsa  id_rsa.pub)私钥和公钥,执行以下指令即可:

                cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

    hello hadoop,大功告成.可以开发了!

到此,关于“hadoop伪分布式的安装方法”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注创新互联网站,小编会继续努力为大家带来更多实用的文章!


新闻标题:hadoop伪分布式的安装方法
本文URL:http://cdiso.cn/article/ijgedo.html

其他资讯