Apache Hive介绍&Hive实现思路模拟
–>
目录
- Hive简介
- 什么是Hive
- 为什么使用Hive
Hive简介
什么是Hive
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射 为一张数据库表,并提供类SQL(Hive SQL 或者 HQL)查询功能。
本质是将SQL转换为MapReduce程序。
主要用途:用来做离线数据分析,比直接用MapReduce开发效率更高。
为什么使用Hive
直接使用Hadoop MapReduce处理数据所面临的的问题:
- 人员学习成本太高
- MapReduce实现复杂查询逻辑开发难度太大
使用Hive:
- 操作接口采用类SQL语法,提供快速开发的能力
- 避免了去写MapReduce,减少开发人员的学习成本
- 功能扩展很方便
本文来源 互联网收集,文章内容系作者个人观点,不代表 本站 对观点赞同或支持。如需转载,请注明文章来源,如您发现有涉嫌抄袭侵权的内容,请联系本站核实处理。
© 版权声明
文章版权归作者所有,未经允许请勿转载。