Apach Superset 이란?
비즈니스 인텔리전스(데이터 시각화) 웹 애플리케이션입니다. 빠르고 가벼우며 직관적이며 사용자가 간단한 원형 차트에서 매우 상세한 지리 공간 차트에 이르기까지 데이터를 탐색하고 시각화할 수 있도록 하는 기능이 포함되어 있습니다.
주요기능
- 데이터세트 시각화 및 대화형 대시보드 제작을 위한 직관적인 인터페이스
- 데이터를 보여줄 수 있는 다양한 시각화
- 데이터 세트를 추출하고 표시하는 코드 없는 시각화 빌더
- 풍부한 메타데이터 브라우저를 포함하여 시각화를 위한 데이터 준비를 위한 세계적 수준의 SQL IDE
- 데이터 분석가가 사용자 정의 측정기준 및 측정항목을 신속하게 정의할 수 있도록 하는 가벼운 의미 계층
- 대부분의 SQL 사용 데이터베이스에 대한 즉시 지원
- 원활한 인메모리 비동기 캐싱 및 쿼리
- 누가 어떤 제품 기능과 데이터 세트에 액세스할 수 있는지에 대한 매우 복잡한 규칙을 구성할 수 있는 확장 가능한 보안 모델입니다.
- 주요 인증 백엔드(데이터베이스, OpenID, LDAP, OAuth, REMOTE_USER 등)와의 통합
- 사용자 정의 시각화 플러그인을 추가하는 기능
- 프로그래밍 방식 사용자 지정을 위한 API
- 처음부터 확장성을 위해 설계된 클라우드 네이티브 아키텍처
Superset 설치
설치는 윈도우10 + anaconda3 + python 3.7 기준으로 설치 방법입니다.
* 아나콘다 : https://www.anaconda.com/products/individual
1) Superset 전용 Python가상환경 생성
# e:\git\da의 루트 디렉토리 생성
e:
md git
md da
# e:\git\da 디렉토리로 이동.
cd git
cd da
#anaconda 기본 가상환경 활성화
#아나콘다 설치 경로를 "C:\ProgramData\Anaconda3\Scripts\activate"로 가정함.
call C:\ProgramData\Anaconda3\Scripts\activate
# "superset"이름으로 python 가상환경 생성한다.
# 명령어를 실행하면 e:\git\da\superset 디렉토리가 생성되고
# 하위에 python 가상환경 런타임 파일들이 생성됩니다.
python -m venv superset
# "superset" python 가상환경 활성화한다.
.\superset\scripts\activate
# superset python 가상환경의 pip 업그레이드
python -m pip install --upgrade pip
Superset 전용 Python가상환경 실행 방법
#anaconda 기본 가상환경 활성화
#아나콘다 설치 경로를 "C:\ProgramData\Anaconda3\Scripts\activate"로 가정함.
call C:\ProgramData\Anaconda3\Scripts\activate
# "superset" python 가상환경 활성화한다.
call e:\git\da\superset\scripts\activate
2) Superset 설치
위의 1)번 과정에서 생성한 Superset Python 가상환경에서 다음 과정을 진행해야 합니다.
# apache-superset 를 설치한다.
pip install apache-superset
# superset 데이터 베이스를 초기화한다.
superset db upgrade
# Admin 유저 생성한다.
set FLASK_APP=superset
superset fab create-admin
# 예제 설치한다.
superset load_examples
#Create default roles and permissions
superset init
superset fab create-admin 명령 실행시 입력한 Username과 Password는 Superset (웹사이트) 로그인시 필요한 정보입니다. 기억하고 있어야 합니다.
3) Superset 서버 실행
# To start a development web server on port 8088, use -p to bind to another port
superset run -p 8088 --with-threads --reload --debugger
브라우저를 실행하여 http://127.0.0.1:8088 로 접근합니다.
아래 화면이 나타나면 superset fab create-admin (admin생성) 명령어로 설정한 Username, Password를 입력합니다.
여기까지 진행하면 Superset 설치는 완료한 것입니다.
몇가지 유용한 것들
Supertset 서버 실행 배치 (runserver.bat)
Supertset Python 가상 환경에 디렉토리(e:\git\da\superset)에 배치 파일이 위치한다는 전제로 작성된 내용입니다.
# 가상환경에서 서버 실행 배치
SET SRC_CD=%~dp0
# Anaconda 가상화 환경을 활성화한다.
call C:\ProgramData\Anaconda3\Scripts\activate
# "superset" 가상화 환경을 활성화한다.
call %SRC_CD%Scripts\activate
# superset 서버 실행.
superset run -p 8088 --with-threads --reload --debugger
PAUSE
Data Source Drivers 설치 배치 (installdrivers.bat)
Supertset Python 가상 환경에 디렉토리(e:\git\da\superset)에 배치 파일이 위치한다는 전제로 작성된 내용입니다.
# Install Databases Drivers
# 드라이버 리스트 : https://superset.apache.org/docs/databases/installing-database-drivers
SET SRC_CD=%~dp0
call C:\ProgramData\Anaconda3\Scripts\activate
call %SRC_CD%Scripts\activate
ECHO mysqlclient install...
pip install mysqlclient
ECHO pyhive(Presto) install...
pip install pyhive
PAUSE
Superset Database 추가
mysql에서 한글 가능하도록 설정한 예시
참고자료
- Installing Superset from Scratch : https://superset.apache.org/docs/installation/installing-superset-from-scratch
'Data Science > Data Visualization' 카테고리의 다른 글
[Visualization] Streamlit Simple Apps : K-Means Clustering (0) | 2023.02.06 |
---|---|
데이터 분석가를 위한 데이터 시각화 솔루션 3종 : Gradio, Streamlit, Dash (0) | 2021.09.17 |
[Grafana] Variables (0) | 2021.09.01 |
[Grafana] Multi-Select Variables --> MYSQL REGEXP (0) | 2021.09.01 |
[JS] Javascript Visualization 라이브러리 (0) | 2021.07.20 |
최근댓글