Hadoop单节点和集群安装课件汇总整本书电子教案全套课件完整版ppt最新教学教程.pptx
《Hadoop单节点和集群安装课件汇总整本书电子教案全套课件完整版ppt最新教学教程.pptx》由会员分享,可在线阅读,更多相关《Hadoop单节点和集群安装课件汇总整本书电子教案全套课件完整版ppt最新教学教程.pptx(389页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Hadoop单节点和集群安装01任务Hadoop系统架构02任务Hadoop单节点和集群安装单元1.4Hadoop单节点和集群安装03任务Hadoop简介1Hadoop简介1Hadoop简介Hadoop作为开源的云计算基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力高速运算和存储。它实现了一个分布式文件系统(Hadoop Distrubuted File System,HDFS),HDFS具有高容错性的特点,并且设计用来部署在价格低廉的硬件上,为海量的数据提供了存储。它实现了MapReduce计算模式,为海量数据计算提供了支持。其下
2、的HBase是一个基于列存储的NoSQL数据库,适合于非结构化数据的存储。Hive是Hadoop下的一个数据仓库,支持类似于SQL语句,操作起来非常简便。2Hadoop系统架构2Hadoop系统架构Hadoop核心Hadoop的核心是两个主要层次,即处理/计算层(MapReduce)和存储层(Hadoop分布式文件系统)。2Hadoop系统架构MapReduce是一种并行编程模型,用于编写Google设计的分布式应用程序,以便以可靠,容错的方式在大型集群(数千个节点)的商用硬件上高效处理大量数据(多TB数据集)。MapReduce程序在Hadoop上运行,Hadoop是一个Apache开源框架
3、。2Hadoop系统架构Hadoop分布式文件系统(HDFS)基于Google文件系统(GFS),提供分布式文件系统,旨在在商用硬件上运行。它与现有的分布式文件系统有许多相似之处。但是,与其他分布式文件系统的差异很大。它具有高度容错性,旨在部署在低成本硬件上。它提供对应用程序数据的高吞吐量访问,适用于具有大型数据集的应用程序。3Hadoop单节点和集群安装3Hadoop单节点和集群安装Hadoop单节点安装(1)下载hadoop压缩文件并上传解压到centos系统中去(这是下载的是hadoop-2.7.5.tar.gz)。#cd/usr -切换到usr目录下#mkdir hadoop -创建h
4、adoop空目录#tar-azxvf/root/hadoop-2.7.5.tar.gz-C/usr/hadoop -解压到刚刚创建hadoop目录中去3Hadoop单节点和集群安装Hadoop单节点安装(2)配置相关信息,修改hadoop-env.sh文件,给其jdk的配置,hadoop依赖jdk。#vim /usr/hadoop/hadoop-2.7.5/etc/hadoop/hadoop-env.sh -编辑该文件#export JAVA_HOME=$JAVA_HOME -加入jdk环境变量 按Esc在按:wq即可修改保存退出3Hadoop单节点和集群安装Hadoop单节点安装(3)修改c
5、ore-site.xml文件(4)修改hdfs-site.xml文件(5)修改marped-site.xml文件(6)格式化hadoop的HDFS文件系统,在hadoop文件中输入#bin/Hadoop NameNode format(7)如果没有异常显示,及说明格式化成功,就可以启动hadoop了,启动hadoop:#sbin/start-all.sh(8)测试是否安装成功,输入:#jps3Hadoop单节点和集群安装Hadoop集群安装通常,集群里的一台机器被指定为 NameNode,另一台不同的机器被指定为JobTracker。这些机器是masters。余下的机器即作为DataNode也
6、作为TaskTracker。这些机器是slaves。Hadoop集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起。3Hadoop单节点和集群安装Hadoop集群安装本集群搭建案例,以3节点为例进行搭建,角色分配如下:hdp-node-01 NameNode SecondaryNameNode ResourceManagerhdp-node-02 DataNode NodeManagerhdp-node-03 DataNode NodeManager3Hadoop单节点和集群安装Hadoop集群安装服务器准备本案例使用虚拟机服务器来搭建Hadoop集群,所用
7、软件及版本:(1)Vmware 12.0(2)Centos 6.6 64bit3Hadoop单节点和集群安装Hadoop集群安装网络环境准备(1)采用NAT方式联网;(2)网关地址:192.168.33.1;(3)3个服务器节点IP地址:192.168.33.101、192.168.33.102、192.168.33.103;(4)子网掩码:255.255.255.03Hadoop单节点和集群安装Hadoop集群安装服务器系统设置(1)添加Hadoop用户(2)为Hadoop用户分配sudoer权限(3)同步时间(4)设置主机名:A:hdp-node-01B:hdp-node-02C:hdp-
8、node-033Hadoop单节点和集群安装Hadoop集群安装服务器系统设置(1)添加Hadoop用户(2)为Hadoop用户分配sudoer权限(3)同步时间(4)设置主机名:A:hdp-node-01、B:hdp-node-02、C:hdp-node-03配置内网域名映射:(A)192.168.33.101 hdp-node-01、(B)192.168.33.102 hdp-node-02、(C)192.168.33.103 hdp-node-03(6)配置ssh免密登陆(7)配置防火墙3Hadoop单节点和集群安装Hadoop集群安装JDK环境安装(1)上传jdk安装包(2)规划安装目
9、录 /home/hadoop/apps/jdk_1.8.0(3)解压安装包(4)配置环境变量/etc/profile3Hadoop单节点和集群安装Hadoop集群安装Hadoop安装部署(1)上传HADOOP安装包(2)规划安装目录 /home/hadoop/apps/hadoop-2.6.5(3)解压安装包 tar zxvf hadoop-2.6.5 C apps/(4)修改配置文件$HADOOP_HOME/etc/hadoop/3Hadoop单节点和集群安装Hadoop集群安装集群启动(1)初始化HDFSbin/hadoop namenode -format(2)启动HDFSsbin/st
10、art-dfs.sh(3)启动YARNsbin/start-yarn.sh(4)查看集群状态jpsThankYOU!Java安装01任务Java与Hadoop的关系02任务Java安装单元1.3Java安装与环境变量的配置03任务Java简介1Java简介1Java简介Java历史Java的历史要追溯到1991年,当时美国Sun Microsystems公司的Patrick Naughton及其伙伴James Gosling带领的工程师小组想要设计一种小型的计算机语言,主要应用对象是像有线电转换盒这类的消费设备。由于这些消费设备的处理能力和内存都很有限,所以语言必须非常小且能够生成非常紧凑的代
11、码。另外,由于不同的设备生厂商会选择不同的中央处理器(CPU),因此这种语言的关键是不能与任何特定的体系结构捆绑在一起。这个项目被命名为Green。1Java简介Java语言特点1.简单性Java中没有指针、结构和类型定义等概念,没有#include和#define等预处理器,也没有多重继承的机制。2Java简介Java语言特点2.面向对象性Java是一个纯粹的面向对象的语言,强调的是面向对象的特性,能够为软件工程技术提供很强的支持。Java语言的设计集中于对象及其接口,它提供了简单的类机制及动态的接口模型。与其他面向对象的语言一样,Java具备继承、封装及多态性这些通常的特性,更提供了一些类
12、的原型,程序员可以通过继承机制,实现代码的复用。2Java简介Java语言特点3.分布式与安全性Java语言包括一个支持HTTP和FTP等基于TCP/IP协议的子库,它提供一个J包,通过它可以完成各种层次上的网络连接。因此Java语言编写的应用程序可以凭借URL打开并访问网络上的对象,其访问方式与访问本地文件系统几乎完全相同。Java语言的另一个Socket类提供了可靠流式网络的连接,使程序设计者可以非常方便地创建分布式应用程序。Java程序在语言定义阶段、字节码检查阶段及程序执行阶段进行的三级代码安全检查机制,对参数类型匹配、对象访问权限,内存回收、Java小应用程序的正确使用等都进行了严格
13、的检查和控制,可以有效地防止非法代码入侵,阻止对内存的越权访问,能够避免病毒的侵害。2Java简介Java语言特点4.与平台无关性Java程序编译后生成二进制代码,即字节码(bytecode)。字节码就是虚拟机的机器指令,与平台无关。字节码有统一的格式,不依赖于具体的硬件环境。在任何安装Java运行时环境的系统上,都可以执行这些代码。2Java简介Java语言特点5.解释和编译特性Java开发环境在Java源程序编译后生成一种称为字节代码(bytecode)的中间代码,字节代码非常类似于机器指令代码,但并不是二进制的机器指令代码,且字节代码不专对一种特定的机器,所以Java程序不需重新编译便可
14、在众多不同的计算机上执行,只要该机器上预先安装有Java语言运行系统,这是其编译特性。Java程序编译后产生字节代码,其运行要借助于Java解释器,Java解释器直接对Java字节代码进行解释执行。2Java简介Java语言特点6.多线程多线程机制使应用程序能够并行执行,通过使用多线程,程序设计者可以分别用不同的线程完成特定的行为,而不需要采用全局的事件循环机制,这样就很容易实现网络上的实时交互行为和实时控制性能。2Java与Hadoop的关系2Java与Hadoop的关系Hadoop使用Java开发的,它运行时需要有一个Java环境,因此在安装运行Hadoop之前需要安装JDK。JDK是Ja
15、va开发工具箱(Java Development Kit)的缩写。自从Java推出以来,JDK已经成为使用最广泛的Java SDK(Software development kit)。JDK是整个Java的核心,包括Java运行环境(Java Runtime Envirnment)一些Java工具和Java基础的类库(rt.jar)。不论什么Java应用服务器实质都是内置了某个版本的JDK。因此掌握JDK是运行Java应用的基础。最主流的JDK是Sun公司(现在已经被Oracle收购)发布的JDK,除了Sun之外,还有许多公司组织都开发了自己的JDK。3Java安装与环境变量的配置3Java安
16、装与环境变量的配置Java安装与环境变量配置第一步:检查系统是否有已经安装好的jdk。具体操作如下:rpm-qa|grep jdk#查看已安装的jdk如果系统已经安装jdk,则需要先卸载对应的jdk,命令如下:rpm-e nodeps jdk-1.7.0_25-fcs.x86_64#卸载对应的jdk3Java安装与环境变量的配置Java安装与环境变量配置第二步:下载JDK访问官方网站https:/ install jdk-8u211-Linux-x64.rpm按照提示,按回车键,即可完成安装。3Java安装与环境变量的配置Java安装与环境变量配置第四步:配置Java环境vim/etc/pro
17、file在文件的最末尾加上如下信息:export JAVA_HOME=/usr/java/jdk1.8.0_40export PATH=$JAVA_HOME/bin:$PATHexport CLASSPATH=.:$JAVA_HOM/lib/dt.jar:$JAVA_HOME/lib/tools.jar3Java安装与环境变量的配置Java安装与环境变量配置第五步:使环境变量生效输入以下命令,使环境变量生效:source/etc/profile第六步:测试Java是否安装成功输入以下命令,测试Java是否安装成功:java-versionThankYOU!Linux基础操作命令01任务Linu
18、x用户和用户组管理02任务Linux基础操作命令单元1.2了解Linux Shell03任务Linux文件和目录管理Linux 基本命令练习04任务1Linux文件和目录管理1Linux文件和目录管理Linux文件层次结构Linux文件和目录组织树状图在Linux操作系统中,所有的文件和目录都被组织成以一个根节点“/”开始的倒置的树状结构。1Linux文件和目录管理Linux目录管理在Linux系统中,一切都是文件,既然是文件,就必须要有文件名。同其他系统相比,Linux操作系统对文件或目录命名的要求相对比较轻松。Linux系统中,文件和目录的命名规则如下:1.除了字符“/”之外,所有的字符都
19、可以使用,但是要注意,在目录名或文件名中,使用某些特殊字符并不是明智之举。2.目录名或文件名的长度不能超过 255 个字符。3.目录名或文件名是区分大小写的。如 pig、PIG、Pig和 PIg,是互不相同的目录名或文件名,但使用字符大小写来区分不同的文件或目录,也是不明智的。4.与 Windows 操作系统不同,文件的扩展名对 Linux 操作系统没有特殊的含义,换句话说,Linux 系统并不以文件的扩展名开分区文件类型。1Linux文件和目录管理Linux路径在Linux系统中,文件是存放在目录中的,而目录又可以存放在其他的目录中,因此,用户(或程序)可以借助文件名和目录名,从文件树中的任
20、何地方开始,搜寻并定位所需的目录或文件。说明目录或文件名位置的方法有两种,分别使用绝对路径和相对路径。绝对路径指的是从根目录(/)开始写起的文件或目录名称,而相对路径则指的是相对于当前路径的写法。简而言之,绝对路径必须以一个正斜线(/),也就是根目录开始,到查找对象(目录或文件)所必须经过的每个目录的名字,它是文件位置的完整路标,因此,在任何情况下都可以使用绝对路径找到所需的文件。2Linux用户和用户组管理2Linux用户和用户组管理Linux用户和用户组1.CentOS用户在CentOS中 账户有两种类型分别是:(1)系统账户:用于守护程序或者其他软件。(2)交互式账户:通常分配给用户以访
21、问系统资源。两种用户类型之间的主要区别是:(1)守护进程使用系统账户来访问文件和目录。这些通常不会通过shell或物理控制台登录进行交互式登录。(2)最终用户使用交互式账户从shell或物理控制台登录访问计算资源。2Linux用户和用户组管理Linux用户和用户组2.用户组用户组是具有相同特征用户的逻辑集合。简单的理解,有时我们需要让多个用户具有相同的权限,比如查看、修改某一个文件的权限,一种方法是分别对多个用户进行文件访问授权,如果有 10 个用户的话,就需要授权 10 次,那如果有 100、1000 甚至更多的用户呢?显然,这种方法不太合理。最好的方式是建立一个组,让这个组具有查看、修改此
22、文件的权限,然后将所有需要访问此文件的用户放入这个组中。那么,所有用户就具有了和组一样的权限,这就是用户组。3了解Linux Shell3了解Linux Shell什么是Shell脚本我们平时所说的 Shell 可以理解为 Linux 系统提供给用户的使用界面。Shell 为用户提供了输入命令和参数并可得到命令执行结果的环境。当一个用户登录 Linux 之后,系统初始化程序 init 就根据/etc/passwd 文件中的设定,为每个用户运行一个被称为 Shell(外壳)的程序。确切地说,Shell 是一个命令行解释器,它为用户提供了一个向 Linux 内核发送请求以便运行程序的界面系统级程序
23、,用户可以用 Shell 来启动、挂起、停止甚至编写一些程序。3了解Linux Shell什么是Shell脚本第一行:“#!/bin/bash”,这句话的作用是标称我以下写的脚本使用的是 Bash 语法,只要写的是基于 Bash 的 Shell 脚本都应该这样开头。第二行:注释,在Linux中,以“#”开头的一般都是注释,除了“#!/bin/bash”这行外,其他行只要以#开头的都是注释。第三行:程序的主体,既然 echo 命令可以直接打印,那么将这句话放入 Shell 脚本中也是可以正确执行的,因为 Linux 的命令是可以直接在脚本中执行的。4Linux 基本命令练习4Linux 基本命令
24、练习命令的基本格式rootsimple02#命令选项参数命令格式中的 代表可选项,也就是有些命令可以不写选项或参数,也能执行4Linux 基本命令练习Linux基础操作命令(1)cd命令rootsimple02#cd相对路径或绝对路径cd 命令,是 Change Directory 的缩写,用来切换工作目录。4Linux 基本命令练习Linux基础操作命令(2)pwd命令rootsimple02#pwdpwd 命令,是 Print Working Directory(打印工作目录)的缩写,功能是显示用户当前所处的工作目录。4Linux 基本命令练习Linux基础操作命令(3)ls命令roots
25、imple02#选项目录名称ls 命令,list 的缩写,是最常见的目录操作命令,其主要功能是显示当前目录下的内容。4Linux 基本命令练习Linux基础操作命令(4)mkdir命令rootsimple02#mkdir-mp目录名mkdir 命令,是 make directories 的缩写,用于创建新目录,此命令所有用户都可以使用。4Linux 基本命令练习Linux基础操作命令(5)rmdir命令rootsimple02#rmdir-p目录名和 mkdir 命令(创建空目录)恰好相反,rmdir(remove empty directories 的缩写)命令用于删除空目录。4Linux
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Hadoop 节点 集群 安装 课件 汇总 电子 教案 全套 完整版 ppt 最新 教学 教程
限制150内