Hive是基于Hadoop的数据仓库解决方案,简单来说,Hive就是在Hadoop上架了一层SQL接口,可以将SQL翻译成MapReduce去Hadoop上执行,这样就使得数据开发和分析人员很方便的使用SQL来完成海量数据的统计和分析,而不必使用编程语言开发MapReduce那么麻烦。
是基于Hadoop的大数据分析必不可少的工具。
文章从浅至深介绍Hive及其使用,非常适合Hadoop、大数据分析的学习者和从业者。
目前共有19节,还在不断更新中:

[一起学Hive]之一–Hive概述,Hive是什么
[一起学Hive]之二–Hive函数大全-完整版
[一起学Hive]之三–Hive中的数据库(Database)和表(Table)
[一起学Hive]之四-Hive的安装配置
[一起学Hive]之五-Hive的视图和分区
[一起学Hive]之六-Hive的动态分区
[一起学Hive]之七-向Hive表中加载数据
[一起学Hive]之八-使用Hive命令行
[一起学Hive]之九-Hive的查询语句SELECT
[一起学Hive]之十-Hive中Join的原理和机制
[一起学Hive]之十一-Hive中Join的类型和用法
[一起学Hive]之十二-Hive SQL的优化
[一起学Hive]之十三-Hive整合HBase,操作HBase表
[一起学Hive]之十四-Hive的元数据表结构详解
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics)
[一起学Hive]之十六-Hive的WEB页面接口-HWI
[一起学Hive]之十七-从Hive表中进行数据抽样-Sampling
[一起学Hive]之十八-Hive UDF开发
[一起学Hive]之十九-使用Hive API分析HQL的执行计划、Job数量和表的血缘关系

阅读原文 »

2 收藏


直接登录

推荐关注