首页 > 技术文章 > Superset可视化数据分析平台

gc2770 2021-07-08 19:59 原文

  1. 背景

Superset 是 Airbnb 开源的数据分析与可视化平台,同时也是由 Python 语言构建的轻量级 BI 系统。Superset 可实现对 TB 量级数据进行处理,兼容常见的数十种关系或非关系型数据库,并在内部实现 SQL 编辑查询等操作。除此之外,基于 Web 服务的 Superset 可实现多用户协使用,并可针对不同角色进行权限管理。Superset 如今已归属于 Apache 孵化项目,并被 Yahoo,豆瓣等国内外知名公司使用。

示例图 截图如下:

 

  1. 环境

  • python2.7

  • superset 0.27

  • centos7 64 位

  1. 适合人群

本课程难度为一般,属于初级级别课程,适合具有 Python 基础,并对数据分析与可视化感兴趣的用户。

  1. 创建虚拟机

使用vagrant+visual box创建centos7 64位虚拟机一台(省略)

  1. 安装superset

5.1 安装依赖的软件包

yum -y install gcc gcc-c++ libffi-devel python-devel python-wheel openssl- devel libsasl2-devel openldap-devel epel-release

 

yum -y install python-pip

 

5.2 安装并更新setuptools和pip

pip install --upgrade setuptools pip

 

5.3 安装click和markdown

pip install click==6.7 "markdown<3.0.0"

 

5.4 查看本地安装版本和最新版本

pip freeze | grep superset

pip install superset==-1

 

当前最新版本为0.27.0

5.5 安装superset

pip install superset

 

文件比较大,需要的依赖包比较多,请耐心等待,如遇报错,大部分是超时造成的,多试几次此命令,直至安装成功。

5.6 安装Mysql驱动

yum -y install mysql-devel

 

pip install mysqlclient

 

5.7 修改数据库连接

vi /usr/lib/python2.7/site-packages/superset/config.py

 

5.7 创建超级用户

fabmanager create-admin --app superset

 

5.8 升级superset数据库配置

superset db upgrade

 

5.9 加载测试样例到数据库(可选)

superset load_examples

 

5.10 初始化角色和权限

superset init

 

  1. 启动superset

nohup superset runserver -p 8000 &

 

  1. 登录WEB界面

访问 http://192.168.56.11:8000

 

点击登录之后,即可进入到主界面

 

8.superset 使用

8.1 查看示例

点击“看板”—>” Misc Charts

 

点击“Charts”—>“Trends”

 

效果还是不错的。

8.2 添加新的数据源

在MYSQL中创建一个新的数据库mydb

 

在superset主界面,点击“数据源”—>”数据库”

 

在弹出界面输入相关信息

 

点击“保存”按钮,我们就成功添加了一个新的数据库源。

 

8.3 添加测试表

在Mysql中添加一张表

 

插入测试数据

INSERT INTO items(pinming,city,price,number)

VALUES

('耐克运动鞋','南京',500,960),

('耐克运动鞋','沈阳',500,830),

('安踏运动鞋','北京',100,900),

('安踏运动鞋','重庆',100,3200),

('安踏运动鞋','贵州',100,1030),

('安踏运动鞋','武汉',100,680);

8.4 SQL 编辑器

在superset界面,点击“SQL工具箱”—>”SQL编辑器”

 

好了,其他的功能自行研究吧。

 

推荐阅读