<3주차 Excel을 활용한 다양한 데이터 분석 실습(3)>
엑셀 데이터의 종류에 대해 알아보기
- 논리데이터
: True(1), False(0)
: 참이나 거짓을 표시하는 데이터
: 논리 함수에 주로 사용됨
- 논리 함수
: 주어진 조건에 따라 참 또는 거짓을 반환
: If, And, OR, NOT 함수 등이 포함됨
- 수식 데이터
: =1+2+3, =SUM(A1, A2)
: 함수 혹은 수식으로 구성되어진 데이터
- 집계함수
: 여러개의 입력을 받아 하나의 결과물 출력
: SUM, MAX, MIN, AVERAGE 등의 함수
엑셀의 집계 함수
SUM
: 모든 범위 값의 한계를 계산
: =SUM(A1:A2)
MAX
: 모든 범위 중의 최댓값을 검색
= MAX(A1:A4)
MIN
: 모든 범위 값 중 최소값을 검샘
= MIN(A1:A4)
AVERAGE
: 모든 범위 값의 평균을 계산
= AVERAGE(A1:A4)
엑셀의 논리 함수
AND
: 인수로 사용되는 논리식과 논리값들이 모두 TRUE여야만 TRUE를 반환
ex. 필기, 실기 모두 80이 넘었는가?
OR
: 인수로 사용되는 논리식과 논리값들 중 어느 하나라도 TRUE면 TRUE를 반환
ex. 필기, 실기 중 하나라도 80이 넘었는가?
IF
: 가장 많이 사용하는 Excel 함수 중 하나
: 특정 값과 예상 값을 비교하여 결과를 도출 가능
: True, False 일 경우의 반환값을 지정하여 결과 반환
ex. 점수가 xx점 이상이라면 합격, 아니면 불합격
함수의 다중 사용
: IF문의 중첩 사용 혹은 다른 함수와의 사용을 통한 예시
ex. IF(AND(필기>60, 실기>60), "합격", "불합격")
-> 필기, 실기가 모두 60이 넘는다면 합격, 그외에는 모두 불합격
<3주차 Excel을 활용한 다양한 데이터 분석 실습(4)>
캐글 시작하기1
캐글이란...
2017년에 구글에서 인수한 데이터분석 프로그램.
경쟁을 할 수 있는 사이트임.
데이터 과학 및 머신러닝 경진 플랫폼. 다양한 데이터 분석 문제 및 상금이 존재함.
강력한 커뮤니티를 기반으로 하기 때문에 큰 장점을 가짐
다양한 엑셀 함수를 사용하여 캐글 데이터 분석 점수 내보기
"Titanic - Machine Learning from Disaster"
- gender_submission.csv
- test.csv
- train.csv
캐글 시작하기2
https://www.kaggle.com/competitions/titanic
Data -> Download All 클릭!
다음과 같은 데이터 형태를 보인다.
각 컬럼은
승객번호
생존여부
승객의 등급
이름
성별
나이
형재, 자매, 배우자의 합
부모, 자식의 합
티켓번호
요금
객실 번호
선착장
을 나타냄!
간단한 엑셀 함수(IF문)만을 사용해 타이타닉 데이터분석을 해보자.
우리가 세울 수 있는 여러가지 가설
1. 여성이면 생존했을 것이다.
=IF(E2="female", "생존", "사망")
2. 등급이 높으면 생존했을 것이다.
= IF(C2=1, "생존", "사망")
: 1등급이면 생존, 2/3등급이면 사망
3. 나이가 어리면 생존했을 것이다.
= IF(F2>20, "사망", "생존")
: 20살 이상이면 사망, 20살 이전이면 생존
4. 앞선 1~3을 조합하여 분석해볼 수도 있음(여성이며 등급이 높은 사람이 생존했을 것이다)
= IF(AND(M2="생존", N2="생존"), "사망")
다양한 함수를 적용하여 gender_submission.csv 파일에 결과값을 넣고(값 빼고는 아무것도 수정하면 안된다)
대회에 제출을 한다.
'STUDY > DevCourse' 카테고리의 다른 글
[데브코스][데이터 분석] RDMS과 SQL 기초 문법 (0) | 2024.03.04 |
---|---|
[데브코스][데이터 분석] Excel을 활용한 다양한 데이터 분석 실습 (5) (0) | 2024.03.01 |
[데브코스][데이터 분석] Excel을 활용한 다양한 데이터 분석 실습 (1), (2) (0) | 2024.02.26 |
[데브코스][데이터 분석] 데이터 활용 시 고려할 점 (1) | 2024.02.23 |
[데브코스][데이터 분석] Gen AI를 이용한 생산성 증대 (0) | 2024.02.22 |