데이터 분석 자료를 시각화하기 위한 다양한 툴들이 있다.
이러한 시각화 툴을 대시보드 혹은 BI(Business Intelligence) 툴 이라고 부른다.
시각화 툴 = 대시보드 = BI(Business Intelligence)
시각화 툴은 KPI, 지표, 중요한 데이터 포인트들을 데이터를 기반으로 계산/분석/표시해주는 툴이며,
데이터 기반 의사결정을 돕는 역할 및 데이터 분석을 쉽게 해주는 역할을 한다.
이러한 시각화 툴이 의미있으면, 데이터의 품질이 보장되어야 한다.
그렇다면, 시각화 툴에는 어떤 툴들이 존재할까?
Excel, Google Spreadsheet
: 사실상 가장 많이 쓰이는 시각화 툴
Python
: 데이터 특성 분석(EDA: Exploratory Data Analysis)에 더 적합
Looker (구글)
: 2019년 구글이 인수했으며, 지금은 구글 클라우드의 일부이다.
* 한국에서는 상대적으로 잘 사용하지 않지만, 해외에서는 많이 사용한다.
-> 처음 배우기 어렵지만, 기능이 굉장히 많아서 좋고, 누가 만들어 놓은 대시보드를 이용할 수 있다는 장점이 있다. (self-service)
(Looker는 수정이 용이하지만 반면에 태블로는 수정이 매우 어렵다)
- LookML이 자체언어로 데이터 모델을 만드는 것으로 시작
- 내부고객뿐만 아니라 외부 고객을 위한 대시보드 작성가능
- 고가의 라이센스 정책을 갖고 있으나 다양한 기능을 제공한다.
Tableau (세일즈포스)
: 2019년 세일즈포스가 인수
- 제품군이 매우 다양하며, 무료 사용 버전이 존재한다.
- 제대로 배우려면 시간이 꽤 필요하지만, 강력한 대시보드 작성이 가능하다. (Looker에 비해서도 더 배우기 어렵다)
- Looker가 뜨기 전까지 오랫동안 마켓리더로 군림되었다.
Power BI (마이크로소프트)
Apache Superset (오픈소스)
: 오픈소스 기반이기에 앞선 Looker, Tableau, Power BI보다는 기능이 적다.
Mode Analytics
: 2013년에 샌프란시스코에서 창업되었다.
- 기술적인 사람들에게 적합한 형태의 대시보드
-> SQL, R, Python 등을 기반으로 데이터 분석이 가능하다.
- KPI 대시보드라기보다 EDA 툴에 가깝다.
ReDash (오픈소스)
https://github.com/getredash/redash
- Superset과 상당히 흡사하며, 더 강력한 쿼리 에디터를 제공하지만 사용자 권한 관련 기능은 다소 부족하다.
- SQL 에디터가 있어 다양한 쿼리를 통해 파악 가능
Google Studio
: 기능이 적음. 그래서 구글에는 Google Studio와 Looker 2개의 시각화 툴이 있다.
AWS Quicksight
: 기능이 적음
이렇게 다양한 시각화 툴 중
Looker or Tableau가 가장 많이 사용되는 추세이다.
그러나, 두 툴 모두 처음 배우는데 시간이 필요하다는 단점이 있으나
태블로의 가격이 더 싸고 투명하며, 무료 버전이 존재한다는 장점이 있다.
데이터의 민주화, 데이터 탈중앙화가 일어나면서 시각화 툴을 활용하기 편해야하는데,
이러한 측면에서는 Looker가 셀프서비스 대시보드를 만들 수 있기 떄문에 더 좋은 선택이지만,
가격이 매우 비싸다는 단점이 있다. 😮💨😭