Posted inhadoop hbase 大数据 Base框架结构 HBase是Hadoop数据库,是一个分布式,可伸缩,面向列,高性能,高可靠性,实时读写,大数据存储区的分布式NOSQL数据库,HBase能够满足随机、实时读/写访问大数据。它是一个非关系型数据库。HBase是在Hadoop和HDFS之上提供了类似BigTable的功能。 Posted by 专注着 10 3 月, 2025Tags: hbase
Posted inhadoop hbase 大数据 HBase基本操作有哪些?一起来看看吧 HBase安装完成后,就需要对HBase的基本操作有一些了解,主要了解数据的存储,数据的读取,数据的删除等,这些操作能够很好的帮助我们认识HBase。同时本文也介绍了HBase的一些数据存储结构,帮助我们深如的了解和学习HBase Posted by 专注着 6 3 月, 2025Tags: hbase
Posted inhadoop hbase 大数据 HBase分布式安装 HBase是在Hadoop体系下很重要的组件,该组装能够对数据存储,数据检索提供比较强劲的性能支持。这篇文章主要介绍了HBase如何进行分布式安装,以及和Hadoop之间的版本依赖,能够帮助我们快速的搭建起Hbase开发环境 Posted by 专注着 1 3 月, 2025Tags: hadoop, hbase
Posted inhadoop hive 大数据 Hive中如何为hiveserver2配置授权? Hive在外部客户端链接时,通常会使用hiveserver2进行配置,为了访问的安全,则需要对hiveserver2进行访问控制,hiveserver2提供了多种授权的方式以供使用,我们可以从中选择一种方式满足需求即可 Posted by 专注着 23 2 月, 2025Tags: hive, hiveserver2
Posted inhadoop hive 大数据 Hive基础知识详解 Hive提供了多种操作数据的方式,但是一些操作比较耗费时间,性能较低,不能满足在写入数据时的性能要求,这篇文章主要介绍Hive的常规操作方式,以及在插入数据时如何能够快速将数据插入到Hive表中,提高写入数据的性能。 Posted by 专注着 14 1 月, 2025Tags: hive
Posted inhadoop hive 大数据 Hive为Hiveserver2客户端授权 hiveserver2为hive提供了远程客户端链接的方式,但是在配置hiveserver2的时候,需要使用用户信息帮助对用户操作进行授权,这篇文章就是说明在hive中如何创建用户并为用户授权,帮助在hive使用过程中进行权限控制,保证数据安全 Posted by 专注着 10 1 月, 2025Tags: hive, hiveserver2
Posted inhadoop hive 大数据 Hive Lateral View、视图和索引创建详解 - Lateral View 用于和UDTF函数(explode, split)结合来使用 - 首先通过UDTF函数拆分成多行,再将多行结果组合成一个支持别名的虚拟表 - 主要解决在select使用UDTF做查询的过程中,查询只能包含单个UDTF, Posted by 专注着 6 1 月, 2025Tags: hive, 索引, 视图
Posted inhadoop 大数据 Hadoop基础概念详解 Hadoop中存在很多的名词,包括各个节点名称,每个节点的用处在这篇文章中都是有介绍了,同时也介绍了Hadoop的数据存储结果,数据存储涉及到的文件,每个文件中存储的内容,在本文章都有比较详细的介绍,同时也介绍了在分布式集群中每个节点的作用。 Posted by 专注着 5 1 月, 2025Tags: hadoop
Posted inhadoop 大数据 Hadoop中MapReduce计算流程详解 在Hadoop中时常需要MapRed任务对已有的文件进行处理,Hadoop定义了MapReduce任务的执行过程,包括了读取文件,文件的Splits, Map任务,Partitioner分区,Sorter排序,Reudcer任务来完成目的,这一篇文章说明了MapReduce任务执行流程 Posted by 专注着 2 1 月, 2025Tags: mapreduce
Hive参数 Hive提供了三种能够设置参数的方法,这三种方法产生的作用于有一定的差别,在开发的过程中需要根据不同的需求设置参数,同时,Hive提供了分桶的操作,分桶能够将数据分布到不同的文件中,然后能够通过抽样的方式满足查询数据的需求。 Posted by 专注着 23 12 月, 2024