< 3주차 Excel을 활용한 다양한 데이터 분석 실습 (1) >
데이터란 무엇인가
: 이론을 세우는 데 기초가 되는 사실, 또는 바탕이 되는 자료
데이터 -> 정보 -> 지식 -> 지혜 순으로 올라감.
데이터를 통해 정보 획득, 이를 통해 지식 획득, 이를 통해 지혜를 획득 가능
실습 준비하기
공공데이터포털 -> 본인이 흥미있는 데이터 찾아보기
< 3주차 Excel을 활용한 다양한 데이터 분석 실습 (2) >
데이터의 종류 및 실습
- 숫자 데이터
: 숫자로 이루어져 있는 데이터
- 문자 데이터
: 문자와 숫자가 혼합된 데이터
: 특정 함수 사용 불가 / 문자열 함수 사용 가능
- 날짜 데이터
: 년, 월, 일 등 날짜를 표시하기 위한 데이터
: 숫자 1은 하루를 의미. 계산 가능
: 하이픈(-) 이나 슬래시(/)로 표현 가능
- 기타
: 논리 데이터, 시간 데이터, 수식 데이터
타이타닉 승객 생존 여부 예측하기 데이터 실습
타이타닉 간이 데이터로 타이타닉 승객 생존 여부를 예측해보자
(승객명, 성별, 나이, 탑승석 등급)
도메인 지식 습득
도메인 지식이란 특정한 전문화된 학문/분야의 지식을 의미한다.
데이터 분석가는 도메인 지식, 수학&통계학 지식, 프로그래밍 지식이 필요함
프로그래밍 지식
- 컴퓨터 과학 지식(CS)
- 프로그래밍 언어
- 데이터베이스
- 각종 프레임워크
- AWS, Firebase
도메인 지식
- 비즈니스 이해/지식
- 전략적 사고/기획력
- 문제 해결능력
- 전문화 된 특정 분야 지식
수학 통계학 지식
- Machine Learning
- 통계학적 모델링
- 각종 수학 지식
- 선형대수, 미적분
- 최적화(Optimization)
타이타닉 실습에서 도메인 지식
: 전문적인 혹은 시대적인 배경에 대한 지식을 습득한 후에 실습을 진행
1. 1912년 당시 "Lady First" 라는 개념이 존재했기 때문에 여성과 아이를 우선적으로 구출함
2. 타이타닉 호에는 부자, 일반인, 가난한 이민자 등의 부류가 있었으며 객실은 1등급, 2등급, 3등급으로 나뉘어져 있음
3. 가난한 이민자는 주로 3등급 객실에 머물렀음.
4. 3등급 객실은 미로처럼 복잡했으며 영어가 불가능한 사람들도 다수 존재했음.
'STUDY > DevCourse' 카테고리의 다른 글
[데브코스][데이터 분석] Excel을 활용한 다양한 데이터 분석 실습 (5) (0) | 2024.03.01 |
---|---|
[데브코스][데이터 분석] Excel을 활용한 다양한 데이터 분석 실습 (3), (4) (1) | 2024.02.29 |
[데브코스][데이터 분석] 데이터 활용 시 고려할 점 (1) | 2024.02.23 |
[데브코스][데이터 분석] Gen AI를 이용한 생산성 증대 (0) | 2024.02.22 |
[데브코스][데이터 분석] 데이터 기반 제품 개선 (0) | 2024.02.21 |