跨象乘云大数据分析平台使用手册.docx
《跨象乘云大数据分析平台使用手册.docx》由会员分享,可在线阅读,更多相关《跨象乘云大数据分析平台使用手册.docx(35页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 跨象乘云大数据分析平台使 用手册目录集群管理.2 数据管理.10 查看文件.11 上传文件.12 删除文件.13Hive 表管理.15 查看表.15 创建表.16 删除表.19 查询表.19HBase 表管理.21 查看表.21 创建表.22 删除表.23禁用表.23 添加数据.23 查询表.24 NBA 投篮分析.24集群管理集群管理1.登录服务器 IP:7180 端口,使用账户登录,即可看到如下界面此页面展示了所有已启动的服务以及集群的性能监控信息 2.点击顶部“主机”菜单,即可看到集群中所有的主机信息这里,我们可以看到所有的节点信息以及它上面所拥有的角色和它的状态等信息。 3.然后,我
2、们点击“Parcel”这里我们可以下载某些包,对我们的环境或某个服务进行升级。 4.点击状态下的 YARN 可以看到yarn 是 hadoop2.x 中引入的,在上面可以运行 MR 以及其他的服务。 5.YARN 的 web ui 提供了两个图形界面,首先,我们看下 jobHistoryUI,如下:这个就是 MR 默认的 job 运行记录6.再来看看 resourceManagerUI这个是 YARN 提供的 application 运行记录 7.在状态下点击 HBase 可以看到:我们可以在状态摘要看到,hbase 安装后拥有的服务。同时,也可以通过此图形化界面进行一些相关的配置。 8.接下
3、来我们看看 table statistic这里展示了 hbase 中表的统计信息。 9.然后,我们看看 hbase web ui,地址为服务器 IP:60010我们可以看到表的列族等信息。 10. 在状态下点击 HDFS 可以看到:我们可以看到 hdfs 的容量状况,读写的情况 11. 我们进入主节点 NameNode,可以浏览 hdfs 中的文件信息,地址为服务器 IP:5007012. 在状态下点击 Hive 可以看到:13. 在状态下点击 Impala 可以看到:impala 与 hive 的区别,一个是在内存中运算,用于实时查询,另一个是启动 MR 运算, 用于离线查询。进入 impa
4、la,可以看到:另外,我们可以点击查询,可以看到我们在 impala-shell 执行过的所有命令,如下:14. zookeeper,动物管理,起到协调作用。进入后,便可看到:数据管理数据管理登录服务器 IP:8888 端口,使用账户登录登录后如下图所示:查查看文件看文件点击左上角的图标,选择 Files即可打开大数据平台的文件系统上上传传文件文件点击右上角的 Upload 按钮这里可以选择文件和压缩文件 下面我们上次一个本地的文件到大数据平台在弹出的窗口中,点击 Select files 按钮,选择要上传的文件。如,我选择 E 盘下一个专利 4.pdf 的文件。双击即可上传删删除文件除文件点
5、击文件前的复选框,然后点击表格上方的 Move to trash 按钮,这里有两个删除选项,第一 项是删除文件到垃圾箱,然后在垃圾箱中可以恢复文件。第二个是永久删除文件。文件其他操作 选中某个文件后,点击表格上方的 Action 按钮,这里我们可以重命名文件,移动文件,复制 文件,下载文件,修改文件权限,文件的概要,设置文件的复制因子等。文件的概要修改文件权限修改文件的复制因子Hive 表管理表管理查查看表看表点击左上角的图标,选择 Tables点击 Tables 后即可看到系统中所有的表当前没有创建表,所以是空的。创创建表建表1.点击表列表的右上角的加号或者左侧菜单中的加号我们可以来添加一张
6、表 2.在这里我们可以基于个文件来创建表3.选择要创建表的数据文件这里我们以 Transactions.csv 文件来创建表,注意:该文件在该手册统计目录中,请自行 上传4.下面需要制定列的分隔符,该文件中的数据是以;分隔的。请填写;然后下面会显示出该文件中解析出来的数据。然后点击下方的 Next 按钮。 5.下面需要指定表名称,表文件的存储类型,表的列。保持默认即可6.点击 Submit 按钮提交 7.之后会在左侧显示表的名称,右侧显示表的详细信息删删除表除表在表信息的右上角有个删除图标可以删除该表查询查询表表1.点击页面上方的 Query 按钮,即可打开查询编辑页面2.在此编辑框内,我们可
7、以对左侧显示的数据表进行查询。 如我们查询 transactions 表的前 10 条数据注意:编辑编辑器右上角的数据器右上角的数据库库的的选择选择,一定要,一定要选择选择好数据好数据库库,否,否则查询则查询的表会找不到的表会找不到。 3.点中要执行的 SQL 语句,点击左下角的运行图标4.查询完成后,会在下方显示查询出的数据HBase 表管理表管理查查看表看表点击左上角的图标,选择 HBase即可查询系统中所有的 HBase 表因为尚未创建表,所以是空的。创创建表建表1.点击右上角的 New Table 来创建2.然后填写表名称,列族3.点击 Submit 提交删删除表除表点击表前方的复选框
8、,然后点击上方的 Drop 按钮即可删除表禁用表禁用表点击表前方的复选框,然后点击上方的 Disable 按钮即可禁用表添加数据添加数据1.点击表名称,可以进入表中,点击右下角 New Row 可以添加新的数据2.输入行键和列信息即可添加数据查询查询表表点击表名称可以查看该表中所有的数据在上方的输入框可以输入条件查询数据。如只查询主键为 0001 的数据NBA 投投篮篮分析分析数据集包括包括了 2014-15 赛季 NBA30 支球队 904 场常规赛 281 名球员将近 13 万的投篮 数据,数据包括比赛双方、主客场、胜负情况、投篮球员、防守球员、投篮距离、命中次数等 21 个变量。数据字段
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 跨象乘云大 数据 分析 平台 使用手册
限制150内