Hive编程指南是教你如何使用hive的SQL方法,hvie 不是一个完整的数据库,其中最大的限制是hive不支持记录级别的更新,插入,删除。但是用户可以通过查询生成新表或者将查询结果导入到文件中。hive是基于mapreduce的,查询速度慢。欢迎来绿色资源网下载。
内容简介:Hive编程指南是一本ApacheHive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。《Hive编程指南》通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,演示Hive如何在Hadoop生态系统进行工作。
Hive编程指南目录:第1章 基础知识
第2章 基础操作
第3章 数据类型和文件格式
第4章 HiveQL:数据定义
第5章 HiveQL:数据操作
第6章 HiveQL:查询
第7章 HiveQL:视图
第8章 HiveQL:索引
第9章 模式设计
第10章 调优
第11章 其他文件格式和压缩方法
第12章 开发
第13章 函数
第14章 Streaming
第15章 自定义Hive文件和记录格式
第16章 Hive的Thrift服务
第17章 存储处理程序和NoSQL
第18章 安全
第19章 锁
第20章 Hive和Oozie整合
第21章 Hive和亚马逊网络服务系统(AWS)
第22章 HCatalog
第23章 案例研究