安装hbase
首先下载hbase的最新稳定版本
http://www.apache.org/dyn/closer.cgi/hbase/
安装到本地目录中,我安装的是当前用户的Hadoop/hbase中
tar -zxvf hbase-0.90.4.tar.gz
单机模式
修改配置文件
conf/hbase_env.sh
配置JDK的路径
修改conf/hbase-site.xml
hbase.rootdir
file:///home/${user.name}/hba...
Hadoop是什么?Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算.
Hadoop框架中最核心设计就是:HDFS和MapReduce.HDFS提供了海量数据的存储,MapR...
可以通过一个简单的例子来说明MapReduce到底是什么:
我们要统计一个大文件中的各个单词出现的次数。由于文件太大。我们把这个文件切分成如果小文件,然后安排多个人去统计。这个过程就是”Map”。然后把每个人统计的数字合并起来,这个就是“Reduce"。
上面的例子如果在MapReduce去做呢,就需要创建一个任务job,由job把文件切分成若干独立的数...
Hadoop上Data Locality的详解
Hadoop上的Data Locality是指数据与Mapper任务运行时数据的距离接近程度(Data Locality in Hadoop refers to the“proximity” of the data with respect to the Mapper tasks working on the data.)
1. why data l...
1. Java安装与环境配置
Hadoop是基于Java的,所以首先需要安装配置好java环境。从官网下载JDK,我用的是1.8版本。 在Mac下可以在终端下使用scp命令远程拷贝到虚拟机linux中。
danieldu@daniels-MacBook-Pro-857 ~/Downloads scp jdk-8u121-linux-x64.tar.gz root@Hadoop100:...
很多Hadoop初学者估计都我一样,由于没有足够的机器资源,只能在虚拟机里弄一个linux安装Hadoop的伪分布,然后在host机上win7里使用eclipse或Intellj idea来写代码测试,那么问题来了,win7下的eclipse或intellij idea如何远程提交map/reduce任务到远程Hado...
关于Maven的使用就不再��嗦了,网上很多,并且这么多年变化也不大,这里仅介绍怎么搭建Hadoop的开发环境。
1. 首先创建工程
复制代码 代码如下:mvn archetype:generate -DgroupId=my.Hadoopstudy -DartifactId=Hadoopstudy -DarchetypeArtifactI...
一、Hadoop的安装
1. 下载地址:https://archive.apache.org/dist/Hadoop/common/我下载的是Hadoop-2.7.3.tar.gz版本。
2. 在/usr/local/ 创建文件夹zookeeper
mkdir Hadoop
3.上传文件到Linux上的/usr/loca...
Hadoop 中 HBase Shell命令的详解
HBase包含可以与HBase进行通信的Shell。 HBase使用Hadoop文件系统来存储数据。所有这些任务发生在HDFS。下面给出的是一些由
常用的HBase Shell命令。
数据操纵语言
命令
说明
命令表达式
...
本文假设Hadoop环境在远程机器(如linux服务器上),Hadoop版本为2.5.2
注:本文eclipse/intellij idea 远程调试Hadoop 2.6.0主要参考了并在其基础上有所调整
由于我喜欢在win7 64位上安装32位的软件,比如32位jdk,32位eclipse,所以虽然本文中的...