介绍
Zeppelin是一个Web笔记形式的交互式数据查询分析工具,可以在线用scala和SQL对数据进行查询分析并生成报表。Zeppelin的后台数据引擎可以是Spark(目前只有Spark),开发者可以通过实现更多的解释器来为Zeppelin添加数据引擎。
详细的介绍看官方文档:http://zeppelin.apache.org/
安装
以下安装是在CDH集群中的有spark gateway、hive gateway客户端的节点
下载安装包:http://zeppelin.apache.org/download.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
|
#解压文件到指定的文件中
tar zxvf zeppelin-0.9.0-bin-all.tgz -C /data
#配置参数
cd /data/zeppelin-0.9.0-bin-all/conf
cp zeppelin-env.sh.template zeppelin-env.sh
cp shiro.ini.template shiro.ini
cp zeppelin-site.xml.template zeppelin-site.xml
#编辑zeppelin-env.sh
#java_home根据自己的安装来配置
export JAVA_HOME=/usr/java/jdk1.8.0_181-amd64
export HADOOP_CONF_DIR=/etc/hadoop/conf
export ZEPPELIN_INTP_CLASSPATH_OVERRIDES=/etc/hive/conf
#配置zeppelin-site.xml
<property>
<name>zeppelin.server.addr</name>
#<value>127.0.0.1</value>
<value>0.0.0.0</value>
<description>Server binding address</description>
</property>
<property>
<name>zeppelin.interpreter.dep.mvnRepo</name>
#<value>https://repo1.maven.org/maven2/</value>
<value>https://mirrors.huaweicloud.com/repository/maven/</value>
<description>Remote principal repository for interpreter's additional dependency loading</description>
</property>
#配置shiro.ini
root = root, admin
#启动程序
bin/zeppelin-daemon.sh start
#8080端口启动了
|
FAQ
总结
持续更新中