hbase安装配置（整合到hadoop）

博主： cto.wang
发布时间：2015 年 06 月 15 日
398次浏览
暂无评论
19926字数
分类： LINUX

<h2>
1. &nbsp;快速单击安装
</h2>
在单机安装Hbase的方法。会引导你通过shell创建一个表，插入一行，然后删除它，最后停止Hbase。只要10分钟就可以完成以下的操作。
<h3>1.1下载解压最新版本</h3>
<h3>选择一个&nbsp;Apache 下载镜像：http://www.apache.org/dyn/closer.cgi/hbase/，下载&nbsp;HBase Releases. 点击&nbsp;stable目录，然后下载后缀为&nbsp;.tar.gz&nbsp;的文件; 例如&nbsp;hbase-0.90.4.tar.gz.</h3>
后面需要安装集群，整合到hadoop，所以注意选择与hadoop对应的版本：
选择 Hadoop 版本对HBase部署很关键。下表显示不同HBase支持的Hadoop版本信息。基于HBase版本，应该选择合适的Hadoop版本。我们没有绑定 Hadoop 发行版选择。可以从Apache使用 Hadoop 发行版，或了解一下Hadoop发行商产品：&nbsp;http://wiki.apache.org/hadoop/Distributions%20and%20Commercial%20Support

Table&nbsp;2.1.&nbsp;Hadoop version support matrix
<table summary="Hadoop version support matrix">
<colgroup>
<col align="left" />
<col align="center" />
<col align="center" />
<col align="center" /></colgroup>
<thead>
<tr class="firstRow">
<th align="left" style="line-height: 1.2">&nbsp;</th>
<th align="center" style="line-height: 1.2">HBase-0.92.x</th>
<th align="center" style="line-height: 1.2">HBase-0.94.x</th>
<th align="center" style="line-height: 1.2">HBase-0.96</th>
</tr>
</thead>
<tbody>
<tr>
<td align="left" style="line-height: 1.2">Hadoop-0.20.205</td>
<td align="center" style="line-height: 1.2">S</td>
<td align="center" style="line-height: 1.2">X</td>
<td align="center" style="line-height: 1.2">X</td>
</tr>
<tr>
<td align="left" style="line-height: 1.2">Hadoop-0.22.x</td>
<td align="center" style="line-height: 1.2">S</td>
<td align="center" style="line-height: 1.2">X</td>
<td align="center" style="line-height: 1.2">X</td>
</tr>
<tr>
<td align="left" style="line-height: 1.2">Hadoop-1.0.x</td>
<td align="center" style="line-height: 1.2">S</td>
<td align="center" style="line-height: 1.2">S</td>
<td align="center" style="line-height: 1.2">S</td>
</tr>
<tr>
<td align="left" style="line-height: 1.2">Hadoop-1.1.x</td>
<td align="center" style="line-height: 1.2">NT</td>
<td align="center" style="line-height: 1.2">S</td>
<td align="center" style="line-height: 1.2">S</td>
</tr>
<tr>
<td align="left" style="line-height: 1.2">Hadoop-0.23.x</td>
<td align="center" style="line-height: 1.2">X</td>
<td align="center" style="line-height: 1.2">S</td>
<td align="center" style="line-height: 1.2">NT</td>
</tr>
<tr>
<td align="left" style="line-height: 1.2">Hadoop-2.x</td>
<td align="center" style="line-height: 1.2">X</td>
<td align="center" style="line-height: 1.2">S</td>
<td align="center" style="line-height: 1.2">S</td>
</tr>
</tbody>
</table>

<table summary="Simple list">
<tbody>
<tr class="firstRow">
<td style="line-height: 1.2">S = supported and tested,支持</td>
</tr>
<tr>
<td style="line-height: 1.2">X = not supported,不支持</td>
</tr>
<tr>
<td style="line-height: 1.2">NT = not tested enough.可以运行但测试不充分</td>
</tr>
</tbody>
</table>
由于 HBase 依赖 Hadoop，它配套发布了一个Hadoop jar 文件在它的&nbsp;lib&nbsp;下。该套装jar仅用于独立模式。在分布式模式下，Hadoop版本必须和HBase下的版本一致。用你运行的分布式Hadoop版本jar文件替换HBase lib目录下的Hadoop jar文件，以避免版本不匹配问题。确认替换了集群中所有HBase下的jar文件。Hadoop版本不匹配问题有不同表现，但看起来都像挂掉了。
安装：

<pre class="brush:python;toolbar:false">$&nbsp;tar&nbsp;xfz&nbsp;hbase-0.90.4.tar.gz
$&nbsp;cd&nbsp;hbase-0.90.4</pre>
现在你已经可以启动Hbase了。但是你可能需要先编辑&nbsp;conf/hbase-site.xml&nbsp;去配置hbase.rootdir，来选择Hbase将数据写到哪个目录 .
单机配置，只需要如下配置hbase-site.xml：

<pre class="brush:python;toolbar:false">&lt;?xml&nbsp;version=&quot;1.0&quot;?&gt;&nbsp;&nbsp;
&lt;?xml-stylesheet&nbsp;type=&quot;text/xsl&quot;&nbsp;href=&quot;configuration.xsl&quot;?&gt;&nbsp;&nbsp;
&lt;configuration&gt;&nbsp;&nbsp;
&nbsp;&nbsp;&lt;property&gt;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&lt;name&gt;hbase.rootdir&lt;/name&gt;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&lt;value&gt;file:///DIRECTORY/hbase&lt;/value&gt;&nbsp;&nbsp;
&nbsp;&nbsp;&lt;/property&gt;&nbsp;&nbsp;
&lt;/configuration&gt;</pre>
<h2>1.2.&nbsp;启动 HBase</h2>
现在启动Hbase:
<pre class="brush:python;toolbar:false;">$&nbsp;./bin/start-hbase.sh
starting&nbsp;Master,&nbsp;logging&nbsp;to&nbsp;logs/hbase-user-master-example.org.out</pre>
现在你运行的是单机模式的Hbaes。所以的服务都运行在一个JVM上，包括Hbase和Zookeeper。Hbase的日志放在<code>logs</code>目录,当你启动出问题的时候，可以检查这个日志。
<h2>1.3.&nbsp;Hbase Shell 练习</h2>
用shell连接你的Hbase
<pre class="brush:python;toolbar:false">$&nbsp;./bin/hbase&nbsp;shell
HBase&nbsp;Shell;&nbsp;enter&nbsp;&#039;help&lt;RETURN&gt;&#039;&nbsp;for&nbsp;list&nbsp;of&nbsp;supported&nbsp;commands.
Type&nbsp;&quot;exit&lt;RETURN&gt;&quot;&nbsp;to&nbsp;leave&nbsp;the&nbsp;HBase&nbsp;Shell
Version:&nbsp;0.90.0,&nbsp;r1001068,&nbsp;Fri&nbsp;Sep&nbsp;24&nbsp;13:55:42&nbsp;PDT&nbsp;2010
&nbsp;
hbase(main):001:0&gt;</pre>
输入&nbsp;help&nbsp;然后&nbsp;&lt;RETURN&gt;&nbsp;可以看到一列shell命令。这里的帮助很详细，要注意的是表名，行和列需要加引号。
创建一个名为&nbsp;<code>test</code>&nbsp;的表，这个表只有一个column family 为&nbsp;<code>cf</code>。可以列出所有的表来检查创建情况，然后插入些值。
<pre class="brush:python;toolbar:false">hbase(main):003:0&gt;&nbsp;create&nbsp;&#039;test&#039;,&nbsp;&#039;cf&#039;
0&nbsp;row(s)&nbsp;in&nbsp;1.2200&nbsp;seconds
hbase(main):003:0&gt;&nbsp;list&nbsp;&#039;table&#039;
test
1&nbsp;row(s)&nbsp;in&nbsp;0.0550&nbsp;seconds
hbase(main):004:0&gt;&nbsp;put&nbsp;&#039;test&#039;,&nbsp;&#039;row1&#039;,&nbsp;&#039;cf:a&#039;,&nbsp;&#039;value1&#039;
0&nbsp;row(s)&nbsp;in&nbsp;0.0560&nbsp;seconds
hbase(main):005:0&gt;&nbsp;put&nbsp;&#039;test&#039;,&nbsp;&#039;row2&#039;,&nbsp;&#039;cf:b&#039;,&nbsp;&#039;value2&#039;
0&nbsp;row(s)&nbsp;in&nbsp;0.0370&nbsp;seconds
hbase(main):006:0&gt;&nbsp;put&nbsp;&#039;test&#039;,&nbsp;&#039;row3&#039;,&nbsp;&#039;cf:c&#039;,&nbsp;&#039;value3&#039;
0&nbsp;row(s)&nbsp;in&nbsp;0.0450&nbsp;seconds</pre>
以上我们分别插入了3行。第一个行key为<code>row1</code>, 列为&nbsp;<code>cf:a</code>， 值是&nbsp;<code>value1</code>。Hbase中的列是由 column family前缀和列的名字组成的，以冒号间隔。例如这一行的列名就是<code>a</code>.
检查插入情况.
Scan这个表，操作如下
<pre class="brush:python;toolbar:false;">hbase(main):007:0&gt;&nbsp;scan&nbsp;&#039;test&#039;</pre>
<pre>ROW&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;COLUMN+CELL</pre>
<pre>row1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;column=cf:a,&nbsp;timestamp=1288380727188,&nbsp;value=value1</pre>
<pre>row2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;column=cf:b,&nbsp;timestamp=1288380738440,&nbsp;value=value2</pre>
<pre>row3&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;column=cf:c,&nbsp;timestamp=1288380747365,&nbsp;value=value3</pre>
<pre>3&nbsp;row(s)&nbsp;in&nbsp;0.0590&nbsp;seconds</pre>
Get一行，操作如下
<pre class="brush:python;toolbar:false;">hbase(main):008:0&gt;&nbsp;get&nbsp;&#039;test&#039;,&nbsp;&#039;row1&#039;</pre>
<pre>COLUMN&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;CELL</pre>
<pre>cf:a&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;timestamp=1288380727188,&nbsp;value=value1</pre>
<pre>1&nbsp;row(s)&nbsp;in&nbsp;0.0400&nbsp;seconds</pre>
disable 再 drop 这张表，可以清除你刚刚的操作
<pre class="brush:python;toolbar:false;">hbase(main):012:0&gt;&nbsp;disable&nbsp;&#039;test&#039;</pre>
<pre>0&nbsp;row(s)&nbsp;in&nbsp;1.0930&nbsp;seconds</pre>
<pre>hbase(main):013:0&gt;&nbsp;drop&nbsp;&#039;test&#039;</pre>
<pre>0&nbsp;row(s)&nbsp;in&nbsp;0.0770&nbsp;seconds</pre>
关闭shell
<pre class="brush:python;toolbar:false">hbase(main):014:0&gt;&nbsp;exit</pre>
<h2>1.4.&nbsp;停止 HBase</h2>
运行停止脚本来停止HBase.
<pre class="brush:python;toolbar:false">$&nbsp;./bin/stop-hbase.sh
stopping&nbsp;hbase...............</pre>
<h2 style="margin: 0px;padding: 0px">
2. &nbsp;Hbase集群安装前注意
</h2>
1）&nbsp;&nbsp;Java：（hadoop已经安装了）
2）&nbsp;&nbsp;Hadoop 0.20.x&nbsp;/ Hadoop-2.x&nbsp;已经正确安装，并且可以启动 HDFS 系统, 可参考的Hadoop安装文档：Hadoop集群配置（最全面总结）http://blog.csdn.net/hguisu/article/details/7237395
3）&nbsp;&nbsp;ssh 必须安装ssh&nbsp;，&nbsp;sshd&nbsp;也必须运行，这样Hadoop的脚本才可以远程操控其他的Hadoop和Hbase进程。ssh之间必须都打通，不用密码都可以登录，详细方法可以&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Google一下 (&quot;ssh passwordless login&quot;).
4）&nbsp;&nbsp;NTP：集群的时钟要保证基本的一致。稍有不一致是可以容忍的，但是很大的不一致会 造成奇怪的行为。 运行&nbsp;NTP&nbsp;或者其他什么东西来同步你的时间.
如果你查询的时候或者是遇到奇怪的故障，可以检查一下系统时间是否正确!
&nbsp;设置集群各个节点时钟：date -s&nbsp;“2012-02-13 14:00:00”
<code>5）&nbsp;&nbsp;</code><code>ulimit</code>&nbsp;和&nbsp;<code>nproc:</code>
Base是数据库，会在同一时间使用很多的文件句柄。大多数linux系统使用的默认值1024是不能满足的，会导致FAQ: Why do I see &quot;java.io.IOException&#8230;(Too manyopen files)&quot; in my logs?异常。还可能会发生这样的异常
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;2010-04-06 03:04:37,542 INFO org.apache.hadoop.hdfs.DFSClient: ExceptionincreateBlockOutputStream java.io.EOFException
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;2010-04-06 03:04:37,542 INFO org.apache.hadoop.hdfs.DFSClient:Abandoning block blk_-6935524980745310745_1391901
所以你需要修改你的最大文件句柄限制。可以设置到10k. 你还需要修改 hbase 用户的 nproc，如果过低会造成 OutOfMemoryError异常。 [2] [3].
需要澄清的，这两个设置是针对操作系统的，不是Hbase本身的。有一个常见的错误是Hbase运行的用户，和设置最大值的用户不是一个用户。在Hbase启动的时候，第一行日志会现在ulimit信息，所以你最好检查一下。&nbsp;
可以先查看当前用户&nbsp;ulimit：
ulimit -n
设置<code>ulimit:</code>
<code>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</code>如果你使用的是Ubuntu,你可以这样设置:
在文件&nbsp;/etc/security/limits.conf&nbsp;添加一行，如:
hadoop&nbsp; &#8211;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; nofile&nbsp;32768
可以把&nbsp;hadoop&nbsp;替换成你运行Hbase和Hadoop的用户。如果你用两个用户，你就需要配两个。还有配nproc hard 和 softlimits. 如:
<pre class="brush:python;toolbar:false">hadoop&nbsp;soft/hard&nbsp;nproc&nbsp;32000</pre>
在&nbsp;/etc/pam.d/common-session&nbsp;加上这一行:
<pre class="brush:python;toolbar:false">session&nbsp;required&nbsp;pam_limits.so</pre>
否则在&nbsp;/etc/security/limits.conf上的配置不会生效.
还有注销再登录，这些配置才能生效!
7 ）修改Hadoop HDFS Datanode同时处理文件的上限：<code>dfs.datanode.max.xcievers</code>
一个 Hadoop HDFS Datanode 有一个同时处理文件的上限. 这个参数叫&nbsp;xcievers&nbsp;(Hadoop的作者把这个单词拼错了). 在你加载之前，先确认下你有没有配置这个文件conf/hdfs-site.xml里面的xceivers参数，至少要有4096:
<pre class="brush:python;toolbar:false">&nbsp;&nbsp;&nbsp;&lt;property&gt;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;name&gt;dfs.datanode.max.xcievers&lt;/name&gt;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;value&gt;4096&lt;/value&gt;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;/property&gt;</pre>
对于HDFS修改配置要记得重启.
如果没有这一项配置，你可能会遇到奇怪的失败。你会在Datanode的日志中看到xcievers exceeded，但是运行起来会报 missing blocks错误。例如:&nbsp;02/12/1220:10:31 INFO hdfs.DFSClient: Could not obtain blockblk_XXXXXXXXXXXXXXXXXXXXXX_YYYYYYYY from any node: java.io.IOException: No livenodes contain current block. Will get new block locations from namenode andretry&#8230;
8）继承hadoop安装的说明：
每个机子/etc/hosts
<pre class="brush:python;toolbar:false">10.64.56.74&nbsp;&nbsp;node2&nbsp;（master）
10.64.56.76&nbsp;&nbsp;node1&nbsp;&nbsp;（slave）
10.64.56.77&nbsp;&nbsp;node3&nbsp;（slave）</pre>
9) 继续使用hadoop用户安装
<pre class="brush:python;toolbar:false">Chown&nbsp;–R&nbsp;hadoop&nbsp;/usr/local/hbase</pre>
<h2 style="margin: 0px;padding: 0px">
3. &nbsp;分布式模式配置
</h2>
<h2>3.1配置<code>conf/hbase-env.sh</code></h2>

<pre class="brush:python;toolbar:false">#&nbsp;exportJAVA_HOME=/usr/java/jdk1.6.0/
exportJAVA_HOME=/usr/lib/jvm/java-6-sun-1.6.0.26
#&nbsp;Tell&nbsp;HBase&nbsp;whether&nbsp;it&nbsp;should&nbsp;manage&nbsp;it&#039;sown&nbsp;instance&nbsp;of&nbsp;Zookeeper&nbsp;or&nbsp;not.
export&nbsp;HBASE_MANAGES_ZK=true</pre>
不管是什么模式，你都需要编辑&nbsp;<code>conf/hbase-env.sh</code>来告知Hbase&nbsp;java的安装路径.在这个文件里你还可以设置Hbase的运行环境，诸如 heapsize和其他&nbsp;JVM有关的选项, 还有Log文件地址，等等. 设置&nbsp;<code>JAVA_HOME</code>指向&nbsp;java安装的路径.
一个分布式运行的Hbase依赖一个zookeeper集群。所有的节点和客户端都必须能够访问zookeeper。默认的情况下Hbase会管理一个zookeep集群。这个集群会随着Hbase的启动而启动。当然，你也可以自己管理一个zookeeper集群，但需要配置Hbase。你需要修改<code>conf/hbase-env.sh</code>里面的<code>HBASE_MANAGES_ZK</code>&nbsp;来切换。这个值默认是true的，作用是让Hbase启动的时候同时也启动zookeeper.
让Hbase使用一个现有的不被Hbase托管的Zookeep集群，需要设置&nbsp;<code>conf/hbase-env.sh</code>文件中的<code>HBASE_MANAGES_ZK</code>&nbsp;属性为 false
# Tell HBase whether it should manage it&#039;s own instanceof Zookeeper or not.
exportHBASE_MANAGES_ZK=false
<h2>3.2 配置conf/hbase-site.xml</h2>

<pre class="brush:python;toolbar:false">&lt;/property&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&lt;property&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&lt;name&gt;hbase.cluster.distributed&lt;/name&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&lt;value&gt;true&lt;/value&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&lt;description&gt;The&nbsp;mode&nbsp;the&nbsp;clusterwill&nbsp;be&nbsp;in.&nbsp;Possible&nbsp;values&nbsp;are&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;false:&nbsp;standalone&nbsp;and&nbsp;pseudo-distributedsetups&nbsp;with&nbsp;managed&nbsp;Zookeeper&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;true:&nbsp;fully-distributed&nbsp;with&nbsp;unmanagedZookeeper&nbsp;Quorum&nbsp;(see&nbsp;hbase-env.sh)&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&lt;/description&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&lt;/property&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&lt;property&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;name&gt;hbase.zookeeper.property.clientPort&lt;/name&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;value&gt;2222&lt;/value&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;description&gt;Property&nbsp;fromZooKeeper&#039;s&nbsp;config&nbsp;zoo.cfg.&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;port&nbsp;at&nbsp;which&nbsp;the&nbsp;clients&nbsp;willconnect.&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;/description&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&lt;/property&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&lt;property&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;name&gt;hbase.zookeeper.quorum&lt;/name&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;value&gt;node1,node2,node3&lt;/value&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;description&gt;Comma&nbsp;separated&nbsp;listof&nbsp;servers&nbsp;in&nbsp;the&nbsp;ZooKeeper&nbsp;Quorum.&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;For&nbsp;example,&quot;host1.mydomain.com,host2.mydomain.com,host3.mydomain.com&quot;.&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;By&nbsp;default&nbsp;this&nbsp;is&nbsp;set&nbsp;to&nbsp;localhost&nbsp;forlocal&nbsp;and&nbsp;pseudo-distributed&nbsp;modes&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;of&nbsp;operation.&nbsp;For&nbsp;a&nbsp;fully-distributedsetup,&nbsp;this&nbsp;should&nbsp;be&nbsp;set&nbsp;to&nbsp;a&nbsp;full&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;list&nbsp;of&nbsp;ZooKeeper&nbsp;quorum&nbsp;servers.&nbsp;IfHBASE_MANAGES_ZK&nbsp;is&nbsp;set&nbsp;in&nbsp;hbase-env.sh&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;this&nbsp;is&nbsp;the&nbsp;list&nbsp;of&nbsp;servers&nbsp;which&nbsp;we&nbsp;willstart/stop&nbsp;ZooKeeper&nbsp;on.&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;/description&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&lt;/property&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&lt;property&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;name&gt;hbase.zookeeper.property.dataDir&lt;/name&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;value&gt;/home/hadoop/zookeeper&lt;/value&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;description&gt;Property&nbsp;fromZooKeeper&#039;s&nbsp;config&nbsp;zoo.cfg.&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;directory&nbsp;where&nbsp;the&nbsp;snapshot&nbsp;isstored.&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;/description&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&lt;/property&gt;&nbsp;&nbsp;
&nbsp;&nbsp;
&nbsp;&nbsp;&lt;/configuration&gt;</pre>
要想运行完全分布式模式，加一个属性&nbsp;<code>hbase.cluster.distributed</code>&nbsp;设置为&nbsp;<code>true</code>&nbsp;然后把&nbsp;<code>hbase.rootdir</code>&nbsp;设置为HDFS的NameNode的位置。 例如，你的namenode运行在node1，端口是49002 你期望的目录是&nbsp;<code>/hbase</code>,使用如下的配置：hdfs://node1:49002/hbase
hbase.rootdir：这个目录是region server的共享目录，用来持久化Hbase。URL需要是&#039;完全正确&#039;的，还要包含文件系统的scheme。例如，要表示hdfs中的&#039;/hbase&#039;目录，namenode 运行在node1的49002端口。则需要设置为hdfs://node1:49002/hbase。默认情况下Hbase是写到/tmp的。不改这个配置，数据会在重启的时候丢失。默认:&nbsp;file:///tmp/hbase-${user.name}/hbase
hbase.cluster.distributed&nbsp;：Hbase的运行模式。false是单机模式，true是分布式模式。若为false,Hbase和Zookeeper会运行在同一个JVM里面。
默认:&nbsp;false
在hbase-site.xml配置zookeeper：
当Hbase管理zookeeper的时候，你可以通过修改zoo.cfg来配置zookeeper，
一个更加简单的方法是在&nbsp;conf/hbase-site.xml里面修改zookeeper的配置。Zookeeer的配置是作为property写在&nbsp;hbase-site.xml里面的。
对于zookeepr的配置，你至少要在&nbsp;hbase-site.xml中列出zookeepr的ensemble servers，具体的字段是&nbsp;hbase.zookeeper.quorum. 该这个字段的默认值是&nbsp;localhost，这个值对于分布式应用显然是不可以的. (远程连接无法使用)。
hbase.zookeeper.property.clientPort：ZooKeeper的zoo.conf中的配置。 客户端连接的端口。
hbase.zookeeper.quorum：Zookeeper集群的地址列表，用逗号分割。例如：&quot;host1.mydomain.com,host2.mydomain.com,host3.mydomain.com&quot;.默认是localhost,是给伪分布式用的。要修改才能在完全分布式的情况下使用。如果在hbase-env.sh设置了HBASE_MANAGES_ZK，这些ZooKeeper节点就会和Hbase一起启动。
默认:&nbsp;localhost
运行一个zookeeper也是可以的，但是在生产环境中，你最好部署3，5，7个节点。部署的越多，可靠性就越高，当然只能部署奇数个，偶数个是不可以的。你需要给每个zookeeper 1G左右的内存，如果可能的话，最好有独立的磁盘。 (独立磁盘可以确保zookeeper是高性能的。).如果你的集群负载很重，不要把Zookeeper和RegionServer运行在同一台机器上面。就像DataNodes 和 TaskTrackers一样
hbase.zookeeper.property.dataDir：ZooKeeper的zoo.conf中的配置。 快照的存储位置
把ZooKeeper保存数据的目录地址改掉。默认值是&nbsp;/tmp&nbsp;，这里在重启的时候会被操作系统删掉，可以把它修改到&nbsp;/home/hadoop/zookeeper&nbsp;(这个路径hadoop用户拥有操作权限)
对于独立的Zookeeper，要指明Zookeeper的host和端口。可以在&nbsp;hbase-site.xml中设置, 也可以在Hbase的CLASSPATH下面加一个zoo.cfg配置文件。 HBase 会优先加载&nbsp;zoo.cfg&nbsp;里面的配置，把hbase-site.xml里面的覆盖掉.
参见&nbsp;http://www.yankay.com/wp-content/hbase/book.html#hbase_default_configurations可以查找hbase.zookeeper.property&nbsp;前缀，找到关于zookeeper的配置。
<h2>3.3 配置conf/regionservers</h2>
Node1
Node2
完全分布式模式的还需要修改<code>conf/regionservers</code>.&nbsp;在这里列出了你希望运行的全部&nbsp;HRegionServer，一行写一个host (就像Hadoop里面的&nbsp;<code>slaves</code>&nbsp;一样). 列在这里的server会随着集群的启动而启动，集群的停止而停止.
<h3>3.4 替换hadoop的jar包</h3>
hbase基本的配置完了。
查看hbase的lib目录下。
ls lib |grep hadoop
 hadoop-annotations-2.1.0-beta.jar hadoop-auth-2.1.0-beta.jar hadoop-client-2.1.0-beta.jar hadoop-common-2.1.0-beta.jar hadoop-hdfs-2.1.0-beta.jar hadoop-hdfs-2.1.0-beta-tests.jar hadoop-mapreduce-client-app-2.1.0-beta.jar hadoop-mapreduce-client-common-2.1.0-beta.jar hadoop-mapreduce-client-core-2.1.0-beta.jar hadoop-mapreduce-client-jobclient-2.1.0-beta.jar hadoop-mapreduce-client-jobclient-2.1.0-beta-tests.jar hadoop-mapreduce-client-shuffle-2.1.0-beta.jar hadoop-yarn-api-2.1.0-beta.jar hadoop-yarn-client-2.1.0-beta.jar hadoop-yarn-common-2.1.0-beta.jar hadoop-yarn-server-common-2.1.0-beta.jar hadoop-yarn-server-nodemanager-2.1.0-beta.jar 
 
看到它是基于hadoop2.1.0的，所以我们需要用我们的hadoop2.2.0下的jar包来替换2.1的，保证版本的一致性，hadoop下的jar包都是在$HADOOP_HOME/share/hadoop下的.
我们先cd 到 /home/hadoop/hbase-0.96.0-hadoop2/lib下运行命令： rm -rf hadoop*.jar删掉所有的hadoop相关的jar包，然后运行：
find /home/hadoop/hadoop-2.2.0/share/hadoop -name &quot;hadoop*jar&quot; | xargs -i cp {}&nbsp;/home/hadoop/hbase-0.96.0-hadoop2/lib/&nbsp;
&nbsp;拷贝所有hadoop2.2.0下的jar包hbase下进行hadoop版本的统一
<h2>
4. &nbsp;运行和确认安装
</h2>
<h2>4.1当Hbase托管ZooKeeper的时候</h2>
当Hbase托管ZooKeeper的时候Zookeeper集群的启动是Hbase启动脚本的一部分
首先确认你的HDFS是运行着的。你可以运行<code>HADOOP_HOME</code>中的&nbsp;<code>bin/start-hdfs.sh</code>&nbsp;来启动HDFS.你可以通过put命令来测试放一个文件，然后有get命令来读这个文件。通常情况下Hbase是不会运行mapreduce的。所以比不需要检查这些。
用如下命令启动Hbase:
bin/start-hbase.sh
这个脚本在<code>HBASE_HOME</code>目录里面。
你现在已经启动Hbase了。Hbase把log记在&nbsp;<code>logs</code>&nbsp;子目录里面. 当Hbase启动出问题的时候，可以看看Log.
Hbase也有一个界面，上面会列出重要的属性。默认是在Master的60010端口上H (HBase RegionServers 会默认绑定 60020端口，在端口60030上有一个展示信息的界面 ).如果Master运行在&nbsp;<code>node1</code>，端口是默认的话，你可以用浏览器在&nbsp;<code>http://node:60010</code>看到主界面. .
一旦Hbase启动，可以看到如何建表，插入数据，scan你的表，还有disable这个表，最后把它删掉。
可以在Hbase Shell停止Hbase
$./bin/stop-hbase.sh
stoppinghbase&#8230;&#8230;&#8230;&#8230;&#8230;
停止操作需要一些时间，你的集群越大，停的时间可能会越长。如果你正在运行一个分布式的操作，要确认在Hbase彻底停止之前，Hadoop不能停.
<h2>4.2独立的zookeeper启动，</h2>
除了启动habse，
执行：bin/start-hbase.sh启动habse
你需要自己去运行zookeeper：
${HBASE_HOME}/bin/hbase-daemons.sh {start,stop} zookeeper
你可以用这条命令启动ZooKeeper而不启动Hbase.&nbsp;HBASE_MANAGES_ZK&nbsp;的值是&nbsp;false， 如果你想在Hbase重启的时候不重启ZooKeeper,你可以这样。
<h2>
5. &nbsp;测试
</h2>
可以使用jps查看进程：在master上：
<img src="//cto.wang/usr/uploads/2016/07/20160703160033-67.jpg" title="1428826304560660.gif" alt="1.gif" />
在node2，node3（slave节点）上
<img src="//cto.wang/usr/uploads/2016/07/20160703160033-77.jpg" title="1428826311810444.gif" alt="2.gif" />
通过浏览器查看60010端口：
<img src="//cto.wang/usr/uploads/2016/07/20160703160033-30.jpg" title="1428826323694145.gif" alt="3.gif" />
<h2 style="margin: 0px;padding: 0px">
1. &nbsp;安装中出现的问题
</h2>
<h2>1 ）</h2>
用./start-hbase.sh启动HBase后，执行hbase shell # bin/hbase shell HBase Shell; enter &#039;help&lt;RETURN&gt;&#039; for list of supported commands. Version: 0.20.6, rUnknown, Thu Oct 28 19:02:04 CST 2010 接着创建表时候出现如下情况：hbase(main):001:0&gt; create &#039;test&#039;,&#039;&#039;c NativeException: org.apache.hadoop.hbase.MasterNotRunningException: null
jps下，发现主节点上HMaster没有启动，查理HBase log（logs/hbase-hadoop-master-ubuntu.log）里有下面异常： FATAL org.apache.hadoop.hbase.master.HMaster: Unhandled exception. Starting shutdown. java.io.IOException: Call to node1/10.64.56.76:49002 failed on local exception: java.io.EOFException
解决：
从hadoop_home/下面cp一个hadoop/hadoop-core-0.20.203.0.jar到hbase_home/lib下。
因为Hbase建立在Hadoop之上，所以他用到了hadoop.jar,这个Jar在 lib 里面。这个jar是hbase自己打了branch-0.20-append 补丁的hadoop.jar. Hadoop使用的hadoop.jar和Hbase使用的 必须 一致。所以你需要将 Hbaselib 目录下的hadoop.jar替换成Hadoop里面的那个，防止版本冲突。比方说CDH的版本没有HDFS-724而branch-0.20-append里面有，这个HDFS-724补丁修改了RPC协议。如果不替换，就会有版本冲突，继而造成严重的出错，Hadoop会看起来挂了。
再用./start-hbase.sh启动HBase后，jps下，发现主节点上HMaster还是没有启动，在HBase log里有下面异常： FATAL org.apache.hadoop.hbase.master.HMaster: Unhandled exception. Starting shutdown. java.lang.NoClassDefFoundError: org/apache/commons/configuration/Configuration 解决： 在NoClassDefFoundError,缺少 org/apache/commons/configuration/Configuration&nbsp; 果断给他加一个commons-configuration包， 从hadoop_home/lib下面cp一个hadoop/lib/commons-configuration-1.6.jar到hbase_home/lib下。
（集群上所有机子的hbase配置都需要一样）
创建表报错：
ERROR: java.io.IOException: Table Namespace Manager not ready yet, try again later at org.apache.hadoop.hbase.master.HMaster.getNamespaceDescriptor(HMaster.java:3101) at org.apache.hadoop.hbase.master.HMaster.createTable(HMaster.java:1738) at org.apache.hadoop.hbase.master.HMaster.createTable(HMaster.java:1777) at org.apache.hadoop.hbase.protobuf.generated.MasterProtos$MasterService$2.callBlockingMethod(MasterProtos.java:38221) at org.apache.hadoop.hbase.ipc.RpcServer.call(RpcServer.java:2146) at org.apache.hadoop.hbase.ipc.RpcServer$Handler.run(RpcServer.java:1851)
解决：
1） 查看集群的所有机器上，
HRegionServer和HQuorumPeer进程是否都启动？
2）查看集群的所有机器的logs是不是有错误消息；
tail -f&nbsp;hbase-hadoop-regionserver-XXX..log&nbsp;
<h2>2&nbsp; 注意事项：</h2>
&nbsp;1）、先启动hadoop后，再开启hbase &nbsp;2）、去掉hadoop的安全模式：hadoop dfsadmin -safemode leave &nbsp;3）、把/etc/hosts里的ubuntu的IP改为服务器当前的IP &nbsp;4)&nbsp; 、确认hbase的hbase-site.xml中 &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp; &lt;name&gt;hbase.rootdir&lt;/name&gt; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;value&gt;hdfs://node：49002/hbase&lt;/value&gt; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 与hadoop的core-site.xml中 &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;name&gt;fs.default.name&lt;/name&gt; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;value&gt;hdfs://node：49002/hbase&lt;/value&gt; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 红字部分保持一致
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;value&gt;hdfs://localhost:8020/hbase&lt;/value&gt;
&nbsp; &nbsp; &nbsp;否则报错：java.lang.RuntimeException: HMaster Aborted
&nbsp;6)、重新执行./start-hbase.sh之前，先kill掉当前的hbase和zookeeper进程
7）hosts注意顺序：
192.168.1.214 master 192.168.1.205 node1 192.168.1.207 node2 192.168.1.209 node3 192.168.1.205 T205.joy.cc
PS：遇到问题时，先查看logs，很有帮助。
HBase 官方文档，全面介绍hbase安装配置：
http://www.yankay.com/wp-content/hbase/book.html#hbase_default_configurations

最后修改：2021 年 12 月 10 日 10 : 53 AM

如果觉得我的文章对你有用，请随意赞赏