hive常通用命令.doc
《hive常通用命令.doc》由会员分享,可在线阅读,更多相关《hive常通用命令.doc(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、.*大数据学习总结 公司对大数据方面也做了不少的培训,自己也学习了一些,在实际应用中也有所体会。针对大数据和关系型数据库有几点感触比较深刻:1.数据存储位置不同。Hive 是建立在 Hadoop 之上的,所有 Hive 的数据都是存储在 HDFS 中的。而数据库则可以将数据保存在块设备或者本地文件系统中。2.数据更新。由于 Hive 是针对数据仓库应用设计的,而数据仓库的内容是读多写少的。因此,Hive 中不支持对数据的改写和添加,所有的数据都是在加载的时候中确定好的。而数据库中的数据通常是需要经常进行修改的,因此可以使用 INSERT INTO . VALUES 添加数据,使用 UPDATE
2、 . SET修改数据.这也是在汇总数据比较痛苦的地方。(_ desc formatted t_cdr_wn1609;OK# col_name data_type comment system_type string record_type string msisdn string real_number string start_datetime string end_datetime string call_duration int session_id string nas_ip string nas_port string nas_type string ip_address strin
3、g status string service_attr string data_flowup int data_flowdn int home_area_code string vlanid string roam_type string billing_type string user_type string fee1 int fee2 int fee3 int old_fee1 int old_fee2 int old_fee3 int info_fee1 string info_fee2 string info_fee3 string file_name string deal_tim
4、e string id_no int group_id string product_code string region_code string brand_code string dealfile string error_code string rb_file_name string call_times int # Partition Information # col_name data_type comment deal_date string sys_type string # Detailed Table Information Database: pprtdb Owner:
5、pprt CreateTime: Fri Sep 02 08:01:24 CST 2016 LastAccessTime: UNKNOWN Protect Mode: None Retention: 0 Location: hdfs:/drmcluster/hive/warehouse/pprtdb.db/t_cdr_wn1609 Table Type: MANAGED_TABLE Table Parameters: transient_lastDdlTime 1472774484 # Storage Information SerDe Library: org.apache.hadoop.h
6、ive.serde2.columnar.ColumnarSerDe InputFormat: org.apache.hadoop.hive.ql.io.RCFileInputFormat OutputFormat: org.apache.hadoop.hive.ql.io.RCFileOutputFormat Compressed: No Num Buckets: -1 Bucket Columns: Sort Columns: Storage Desc Params: field.delim | line.delim n serialization.format | Time taken:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- hive 通用 命令
限制150内