2022年HIVE开发规范 .pdf
《2022年HIVE开发规范 .pdf》由会员分享,可在线阅读,更多相关《2022年HIVE开发规范 .pdf(3页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Hive 开发规范1. 表建表示例1.1. 命名表名称由字母、数字、下划线组成,不同单词之间用下划线分开采用 “数据层次缩写_数据表名“ 格式命名。数据层次缩写包括(dpods,dpdw,dpmid,dpdm,dprpt)dpods:存放从原系统采集来的原始数据dpdw:保存经过清洗,转换和重新组织的历史数据,数据将保留较长时间,满足系统最细粒度的查询需要.dpmid:模型计算中间结果。减少重复计算,降低事实表访问和计算压力。dpdm:数据集市。基于部门或某一特定分析主题需要dprpt:直接面向用户的报表临时表命名: dpstg_数据表名_YYYYMMDD外部表命名:数据层次缩写_ext_数据
2、表名其它团队表命名:数据层次缩写_团队名缩写_数据表名1.2. 文件格式缺省使用 RCFILE 1.3. 分隔符:Hive 表缺省使用:FIELDS TERMINATED BY 005 COLLECTION ITEMS TERMINATED BY 002 MAP KEYS TERMINATED BY 003 LINES TERMINATED BY n 1.4 空值所有建表语句原则上执行以下语句设置表的空值选项:ALTER TABLE table_name SET SERDEPROPERTIES(serialization.null.format = ); 名师资料总结 - - -精品资料欢迎下
3、载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 3 页 - - - - - - - - - 1.5 其他建表和加载分区时加上 if not exists 删除表时加上 drop table if exists 深刻理解 hive 内部表与外部表的区别,删除表操作时要谨慎。如果是内部表的话,删除内部表会将元数据和真实数据全部删除,且不可恢复。2. Column 2.1. 命名字段:小写字母、数字、下划线组成,不同单词之间用下划线分开分区列:采用 “ hp_字段名” 命名分区列2.2. 字段类型时间: STRIN
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年HIVE开发规范 2022 HIVE 开发 规范
限制150内