介绍

Zeppelin是一个Web笔记形式的交互式数据查询分析工具,可以在线用scala和SQL对数据进行查询分析并生成报表。Zeppelin的后台数据引擎可以是Spark(目前只有Spark),开发者可以通过实现更多的解释器来为Zeppelin添加数据引擎。

详细的介绍看官方文档:http://zeppelin.apache.org/

安装

以下安装是在CDH集群中的有spark gateway、hive gateway客户端的节点

下载安装包:http://zeppelin.apache.org/download.html

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
#解压文件到指定的文件中
tar zxvf zeppelin-0.9.0-bin-all.tgz -C /data

#配置参数
cd /data/zeppelin-0.9.0-bin-all/conf
cp zeppelin-env.sh.template zeppelin-env.sh
cp shiro.ini.template shiro.ini
cp zeppelin-site.xml.template zeppelin-site.xml

#编辑zeppelin-env.sh
#java_home根据自己的安装来配置
export JAVA_HOME=/usr/java/jdk1.8.0_181-amd64
export HADOOP_CONF_DIR=/etc/hadoop/conf
export ZEPPELIN_INTP_CLASSPATH_OVERRIDES=/etc/hive/conf

#配置zeppelin-site.xml
<property>
  <name>zeppelin.server.addr</name>
  #<value>127.0.0.1</value>
  <value>0.0.0.0</value>
  <description>Server binding address</description>
</property>

<property>
  <name>zeppelin.interpreter.dep.mvnRepo</name>
  #<value>https://repo1.maven.org/maven2/</value>
  <value>https://mirrors.huaweicloud.com/repository/maven/</value>
  <description>Remote principal repository for interpreter's additional dependency loading</description>
</property>

#配置shiro.ini
root = root, admin

#启动程序
bin/zeppelin-daemon.sh start

#8080端口启动了

FAQ

总结

持续更新中