hbase

Base框架结构

HBase是Hadoop数据库,是一个分布式,可伸缩,面向列,高性能,高可靠性,实时读写,大数据存储区的分布式NOSQL数据库,HBase能够满足随机、实时读/写访问大数据。它是一个非关系型数据库。HBase是在Hadoop和HDFS之上提供了类似BigTable的功能。
hbase

HBase分布式安装

HBase是在Hadoop体系下很重要的组件,该组装能够对数据存储,数据检索提供比较强劲的性能支持。这篇文章主要介绍了HBase如何进行分布式安装,以及和Hadoop之间的版本依赖,能够帮助我们快速的搭建起Hbase开发环境
Hive

Hive基础知识详解

Hive提供了多种操作数据的方式,但是一些操作比较耗费时间,性能较低,不能满足在写入数据时的性能要求,这篇文章主要介绍Hive的常规操作方式,以及在插入数据时如何能够快速将数据插入到Hive表中,提高写入数据的性能。
Hadoop节点交互流程

Hadoop基础概念详解

Hadoop中存在很多的名词,包括各个节点名称,每个节点的用处在这篇文章中都是有介绍了,同时也介绍了Hadoop的数据存储结果,数据存储涉及到的文件,每个文件中存储的内容,在本文章都有比较详细的介绍,同时也介绍了在分布式集群中每个节点的作用。
hadoop

Hadoop中MapReduce计算流程详解

在Hadoop中时常需要MapRed任务对已有的文件进行处理,Hadoop定义了MapReduce任务的执行过程,包括了读取文件,文件的Splits, Map任务,Partitioner分区,Sorter排序,Reudcer任务来完成目的,这一篇文章说明了MapReduce任务执行流程