LOADING

Apache Hive介绍&Hive实现思路模拟

–>

目录

    • Hive简介
      • 什么是Hive
      • 为什么使用Hive

Hive简介

什么是Hive

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射 为一张数据库表,并提供类SQL(Hive SQL 或者 HQL)查询功能。
本质是将SQL转换为MapReduce程序。
主要用途:用来做离线数据分析,比直接用MapReduce开发效率更高。

为什么使用Hive

直接使用Hadoop MapReduce处理数据所面临的的问题:

  • 人员学习成本太高
  • MapReduce实现复杂查询逻辑开发难度太大

使用Hive:

  • 操作接口采用类SQL语法,提供快速开发的能力
  • 避免了去写MapReduce,减少开发人员的学习成本
  • 功能扩展很方便

本文来源 互联网收集,文章内容系作者个人观点,不代表 本站 对观点赞同或支持。如需转载,请注明文章来源,如您发现有涉嫌抄袭侵权的内容,请联系本站核实处理。

© 版权声明

相关文章