hive架构[hive架构图]_币百科_智行理财网

hive架构[hive架构图]

小清 0

欧易okx交易所下载

欧易交易所又称欧易OKX,是世界领先的数字资产交易所,主要面向全球用户提供比特币、莱特币、以太币等数字资产的现货和衍生品交易服务,通过使用区块链技术为全球交易者提供高级金融服务。

APP下载   官网注册

本篇文章给大家谈谈hive架构,以及hive架构图对应的知识点,致力于为用户带来全面可靠的币圈信息,希望对各位有所帮助!

此外,hive也支持熟悉map-reduce的开发者使用map-reduce程序对数据做更加复杂的分析。

hive可以很好的结合thrift和控制分隔符,也支持用户自定义分隔符。

hive基于hadoop,hadoop是批处理系统,不能保存低延迟,因此,hive的查询也不能保证低延迟。

hive的工作模式是:提交一个任务,等到任务结束时被通知,而不是实时查询。相对应的是,类似于Oracle这样的系统当运行于小数据集的时候,响应非常快,可当处理的数据集非常大的时候,可能需要数小时。需要说明的是,hive即使在很小的数据集上运行,也可能需要数分钟才能完成。

低延迟不是hive追求的首要目标。

Hive和Hbase是两种基于Hadoop的不同技术–Hive是一种类SQL的引擎,并且运行MapReduce任务,Hbase是一种在Hadoop之上的NoSQL 的Key/vale数据库。当然,这两种工具是可以同时使用的。就像用Google来搜索,用FaceBook进行社交一样,Hive可以用来进行统计查询,HBase可以用来进行实时查询,数据也可以从Hive写到Hbase,设置再从Hbase写回Hive

共同点:

1.hbase与hive都是架构在hadoop之上的。都是用hadoop作为底层存储

区别:

1.Hive是建立在Hadoop之上为了减少MapReduce jobs编写工作的批处理系统,HBase是为了支持弥补Hadoop对实时操作的缺陷的项目 。

2.想象你在操作RMDB数据库,如果是全表扫描,就用Hive+Hadoop,如果是索引访问,就用HBase+Hadoop 。

3.Hive query就是MapReduce jobs可以从5分钟到数小时不止,HBase是非常高效的,肯定比Hive高效的多。

4.Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce,Hive中的表纯逻辑,就只是表的定义等,即表的元数据。这样就可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,并将SQL语句最终转换为MapReduce任务进行运行。

5.hive借用hadoop的MapReduce来完成一些hive中的命令的执行

6.hbase是物理表,不是逻辑表,提供一个超大的内存hash表,搜索引擎通过它来存储索引,方便查询操作。

7.hbase是列存储。

8.hdfs作为底层存储,hdfs是存放文件的系统,而Hbase负责组织文件。

9.hive需要用到hdfs存储文件,需要用到MapReduce计算框架。

应该是Hadoop在hbase和Hive中的作用吧。 hbase与hive都是架构在hadoop之上的。都是用hadoop作为底层存储。而hbase是作为分布式数据库,而hive是作为分布式数据仓库。当然hive还是借用hadoop的MapReduce来完成一些hive中的命令的执行。而hbase与hive都是单独安装的。你需要哪个安装哪个,所以不存在重复信息。

hive架构是很多人头疼的问题,尤其是在理解和现实的冲突方面,hive架构图也同样面临着相似的问题,关注我们,为您服务,是我们的荣幸!

相关内容

标签: hive hbase mapreduce
hive架构[hive架构图]文档下载: PDF DOC TXT