# Apache Hive

**Apache Hive**是一个建立在[Hadoop](https://zh.wikipedia.org/wiki/Hadoop)架构之上的数据仓库。它能够提供数据的精炼，查询和分析。Apache Hive起初由[Facebook](https://zh.wikipedia.org/wiki/Facebook)开发，目前也有其他公司使用和开发Apache Hive，例如[Netflix](https://zh.wikipedia.org/wiki/Netflix)等。[亚马逊公司](https://zh.wikipedia.org/wiki/%E4%BA%9A%E9%A9%AC%E9%80%8A%E5%85%AC%E5%8F%B8)也开发了一个定制版本的Apache Hive，亚马逊网络服务包中的Amazon Elastic MapReduce包含了该定制版本。

[hive](https://hive.apache.org/)是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的[SQL](https://zh.wikipedia.org/wiki/SQL)查询功能，可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。
