一.序言
最近需要常见数据可视化的东西,主要是方便spark-sql ,方便内部操作方便,因此选择了个数据可视化的,hue 和 zepplin ,hue 是比较强大的,但是spark 方便也是孵化状态,是非apache 的, 先尝试下 Zeppelin 部署,最新0.6的不稳定,编译不过去,就用0.5吧。
下载地址:https://github.com/apache/incubator-zeppelin/releases
二.编译:
1.解压:
tar -zxvf incubator-zeppelin-0.5.0.tar.gz
2.编译:我是spark1.4.1 +hadoop 2.7.1,0.5 支持到 spark 1.4.0 hadoop 2.6
mvn clean package -Pspark-1.4 -Dspark.version=1.4.1 -Dhadoop.version=2.7.1 -Phadoop-2.6 -DskipTests
如果全部OK 就可以了,按描述的启动就行了:https://github.com/apache/incubator-zeppelin
三.其他问题:
因为依赖maven npm node.js 等,需要自己安装~。~ ,而且版本对应 自己去pom 里面去看看,如果出错,多半就是这个原因了。当然我把我编译好的 拿出来直接用吧,记得配置spark/hadoop home 哦
下载地址:http://pan.baidu.com/s/1bnhUI6r
小结:
1.这东西因为是孵化项目,变化挺快的,因此稍微麻烦点,纠结纠结就好。
2.关于一些操作,就看文档吧
参考文档
http://zeppelin.incubator.apache.org/:
http://zeppelin.incubator.apache.org/docs/interpreter/spark.html
别人的安装例子:
http://blog.csdn.net/pelick/article/details/45934993
相关推荐
数据流向:数据仓库怎么理解?两种东西,其一是IBM微软数据产品为代表的,其二是Hadoop+Hive+Apache Hive数据仓库软件有助于使用SQL读取,写入和管理驻留在分布式存储中的大型数据集。 可以将结构投影到已经存储的...
2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。...
ApacheZeppelin是一个基于Web的交互式数据分析开源框架,提供了数据分析、数据可视化等功能。支持多种语言,包括Scala、Python、SparkSQL、Hive、Markdown、Shell等。本文从需求出发,探索Zeppelin的架构设计、技术...
包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。 包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、python...
Zeppelin可实现你所需要的:-数据采集-数据发现-数据分析-数据可视化和协作支持多种语言,默认是scala(背后是sparkshell),SparkSQL,Markdown和Shell。甚至可以添加自己的语言支持。如何写一个zeppelin解释器...
Zeppelin是一个基于Web的notebook,提供交互数据分析和可视化。后台支持接入多种数据处理引擎,如spark,hive等。支持多种语言: Scala(ApacheSpark)、Python(ApacheSpark)、SparkSQL、 Hive、Markdown、Shell等。...
在编写Flink,Spark,Hive等相关作业时,要是能快速的将我们所编写的作业能可视化在我们面前,是件让人兴奋的时,如果能带上趋势功能就更好了。今天,给大家介绍这么一款工具。它就能满足上述要求,在使用了一段时间...
结果集:多个结果集支持,自定义结果集别名和一键式可视化。 数据库服务:用于数据库管理和文件(CVS,Excel)导入表或从表导出的功能。 上下文:UDF,自定义变量以及函数的管理和共享。 控制台:引擎参数,任务/...
6)Stream procressing(流式计算) 6)Stream procressing(流式计算) Storm(实时数据处理分析) Kafka(分布式发布订阅消息系统) 拖放可视化设计,开发,部署和管理流式数据分析应⽤程序 进⾏事件关联,上下⽂衔接,...
Apache Sedona:trade_mark:(孵化)是用于处理大规模空间数据的集群计算系统。... 威兹RDD,SQL /数据框空间RDD和DataFrame的可视化齐柏林飞艇阿帕奇·齐柏林Apache Zeppelin的插件0.8.1+Sedona支持
通过统一的UI,类似于工作流的图形拖放开发体验可满足数据应用程序开发的整个生命周期,包括数据导入,脱敏清理,数据分析,数据挖掘,质量检查,可视化,计划到数据输出应用程序等。 。 借助Linkis的连接,可重用...
强大,可靠的数据处理分发工具 Presto 分布式大数据SQL查询引擎 Cassandra 一个面向列式存储的数据库 Greenplum Database 旗舰分析数据仓库 Superset 可视化分析工具 Livy REST Service for spark 大数据图标大全...