2022
我们一起努力

Linux系统搭建hadoop集群(保姆教程)

Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。该平台使用的是面向对象编程语言Java实现的,具有良好的可移植性。下面一起看一下Linux系统中搭建hadoop集群的详细教程。

u=3176153666,1876072906&fm=26&gp=0

HADOOP简介:

  • Hadoop,是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。

  • 简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。该平台使用的是面向对象编程语言Java实现的,具有良好的可移植性。

Linux系统安装HADOOP步骤:

1尝试新建一个名为hadoop的用户并且设置密码(同时添加管理员权限):

在这里插入图片描述

但是在刚开始就遇到了问题:由于我们下载的Hadoop和jdk在Windows下下载的,将文件共享进ubuntu时,只能共享到第一个创建的用户(我也不知道为什么),而且ubuntu下网络很慢,所以,我就没有创建新的用户,在原有的用户上进行的安装(后面运行成功证实是可以的)。

2.更新apt,下载vim

在这里插入图片描述

3.安装SSH、配置SSH无密码登陆:(提示(SSH首次登陆提示),输入 yes 。然后按提示输入密码 hadoop,这样就登陆到本机了)

在这里插入图片描述

4.安装jdk(在Linux命令行界面中,执行如下Shell命令):

在这里插入图片描述

解压过程:在这里插入图片描述

JDK文件解压缩以后,可以执行如下命令到/usr/lib/jvm目录查看一下:在这里插入图片描述继续执行如下命令,设置环境变量:在这里插入图片描述面命令使用vim编辑器打开了hadoop这个用户的环境变量配置文件,在这个文件的开头位置,添加如下几行内容(注意自己的jdk 版本号):在这里插入图片描述

5.安装hadoop3.2.1(Hadoop 解压后即可使用。输入如下命令来检查 Hadoop 是否可用,成功则会显示 Hadoop 版本信息):

在这里插入图片描述

总体的命令:在这里插入图片描述

6.Hadoop单机配置(非分布式):(Hadoop 默认模式为非分布式模式(本地模式),无需进行其他配置即可运行)

运行例子:在这里插入图片描述

在此我们选择运行 grep 例子,我们将 input 文件夹中的所有文件作为输入,筛选当中符合正则表达式 dfs[a-z.]+ 的单词并统计出现的次数,最后输出结果到 output 文件夹中在这里插入图片描述最后的结果与教程相符合:在这里插入图片描述将 ./output 删除在这里插入图片描述

7. Hadoop伪分布式配置

修改配置文件 core-site.xml (通过 gedit 编辑会比较方便: gedit ./etc/hadoop/core-site.xml),在这里插入图片描述修改为:在这里插入图片描述同样的,修改配置文件 hdfs-site.xml:在这里插入图片描述配置完成后,执行 NameNode 的格式化:在这里插入图片描述开启 NameNode 和 DataNode 守护进程:在这里插入图片描述还好没有教程中的错误:在这里插入图片描述在这里插入图片描述网页面中打开9870端口:在这里插入图片描述到这里表明已经成功!

四、 实验中遇到的问题和解决办法,总结

问题一:Ubuntu和Windows之间的文件传输,拖拽,共享粘贴板。解决办法:安装VBox的增强功能,以及设置如下的地方(自行百度):在这里插入图片描述

在这里插入图片描述在这里插入图片描述问题二:新用户下,不能拖拽文件(就算是管理员也不行)没有解决,因此没有在新用户hadoop下安装,但是最后仍然是成功的

以上就是良许教程网为各位朋友分享的Linux系统相关内容。想要了解更多Linux相关知识记得关注公众号“良许Linux”,或扫描下方二维码进行关注,更多干货等着你!

137e00002230ad9f26e78-265x300

本文来源:www.lxlinux.net/1058.html,若引用不当,请联系修改。

赞(0)
文章名称:《Linux系统搭建hadoop集群(保姆教程)》
文章链接:https://www.fzvps.com/151381.html
本站文章来源于互联网,如有侵权,请联系管理删除,本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。
图片版权归属各自创作者所有,图片水印出于防止被无耻之徒盗取劳动成果的目的。

评论 抢沙发

评论前必须登录!