데이터 분석 자료를 시각화하기 위한 다양한 툴들이 있다.
이러한 시각화 툴을 대시보드 혹은 BI(Business Intelligence) 툴 이라고 부른다.
시각화 툴 = 대시보드 = BI(Business Intelligence)
시각화 툴은 KPI, 지표, 중요한 데이터 포인트들을 데이터를 기반으로 계산/분석/표시해주는 툴이며,
데이터 기반 의사결정을 돕는 역할 및 데이터 분석을 쉽게 해주는 역할을 한다.
이러한 시각화 툴이 의미있으면, 데이터의 품질이 보장되어야 한다.
그렇다면, 시각화 툴에는 어떤 툴들이 존재할까?
Excel, Google Spreadsheet
: 사실상 가장 많이 쓰이는 시각화 툴
Python
: 데이터 특성 분석(EDA: Exploratory Data Analysis)에 더 적합
Looker (구글)
: 2019년 구글이 인수했으며, 지금은 구글 클라우드의 일부이다.
* 한국에서는 상대적으로 잘 사용하지 않지만, 해외에서는 많이 사용한다.
-> 처음 배우기 어렵지만, 기능이 굉장히 많아서 좋고, 누가 만들어 놓은 대시보드를 이용할 수 있다는 장점이 있다. (self-service)
(Looker는 수정이 용이하지만 반면에 태블로는 수정이 매우 어렵다)
- LookML이 자체언어로 데이터 모델을 만드는 것으로 시작
- 내부고객뿐만 아니라 외부 고객을 위한 대시보드 작성가능
- 고가의 라이센스 정책을 갖고 있으나 다양한 기능을 제공한다.
Tableau (세일즈포스)
: 2019년 세일즈포스가 인수
- 제품군이 매우 다양하며, 무료 사용 버전이 존재한다.
- 제대로 배우려면 시간이 꽤 필요하지만, 강력한 대시보드 작성이 가능하다. (Looker에 비해서도 더 배우기 어렵다)
- Looker가 뜨기 전까지 오랫동안 마켓리더로 군림되었다.
Power BI (마이크로소프트)
Apache Superset (오픈소스)
: 오픈소스 기반이기에 앞선 Looker, Tableau, Power BI보다는 기능이 적다.
Mode Analytics
: 2013년에 샌프란시스코에서 창업되었다.
- 기술적인 사람들에게 적합한 형태의 대시보드
-> SQL, R, Python 등을 기반으로 데이터 분석이 가능하다.
- KPI 대시보드라기보다 EDA 툴에 가깝다.
ReDash (오픈소스)
https://github.com/getredash/redash
GitHub - getredash/redash: Make Your Company Data Driven. Connect to any data source, easily visualize, dashboard and share your
Make Your Company Data Driven. Connect to any data source, easily visualize, dashboard and share your data. - getredash/redash
github.com
- Superset과 상당히 흡사하며, 더 강력한 쿼리 에디터를 제공하지만 사용자 권한 관련 기능은 다소 부족하다.
- SQL 에디터가 있어 다양한 쿼리를 통해 파악 가능
Google Studio
: 기능이 적음. 그래서 구글에는 Google Studio와 Looker 2개의 시각화 툴이 있다.
AWS Quicksight
: 기능이 적음
이렇게 다양한 시각화 툴 중
Looker or Tableau가 가장 많이 사용되는 추세이다.
그러나, 두 툴 모두 처음 배우는데 시간이 필요하다는 단점이 있으나
태블로의 가격이 더 싸고 투명하며, 무료 버전이 존재한다는 장점이 있다.
데이터의 민주화, 데이터 탈중앙화가 일어나면서 시각화 툴을 활용하기 편해야하는데,
이러한 측면에서는 Looker가 셀프서비스 대시보드를 만들 수 있기 떄문에 더 좋은 선택이지만,
가격이 매우 비싸다는 단점이 있다. 😮💨😭