전체 글

안녕하세요, 데이터 분석가를 꿈꾸는 개인기록 블로그입니다:)
시각화(Visualization) : 시각화는 데이터 분석 결과를 plot 이나 graph를 통해 시각적으로 전달할 수 있는 방법 -> 분석 내용 한 눈에 확인 가능, 통계 수치상으로 파악하기 쉽지 않은 내용 파악 가능(ex. 데이터 분포) matplotlib - 파이썬의 라이브러리. numpy나 pandas의 자료구조 시각화 가능 import matplotlib.pyplot as plt plt.plot() # 플롯 확인 가능 plt.show() # 파일 저장 # dpi=500 : 해상도 plt.savefig('filename', dpi=500) # 타이틀 지정 plt.title("xxx") # 축 label plt.xlabel("00", f..
문제 설명 https://school.programmers.co.kr/learn/courses/30/lessons/133025 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 내 풀이 SELECT FIRST_HALF.FLAVOR FROM FIRST_HALF INNER JOIN ICECREAM_INFO ON FIRST_HALF.FLAVOR = ICECREAM_INFO.FLAVOR WHERE 1=1 AND ICECREAM_INFO.INGREDIENT_TYPE = 'fruit_based' AND FIRST_HALF.TOTAL_ORDER >= 3000 ORDER ..
문제 설명 https://school.programmers.co.kr/learn/courses/30/lessons/120875 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 내 풀이 def solution(dots): # 기울기가 같으면 평행(기울기 = y좌표차이/x좌표차이) # 3개의 조건: 12/34 13/24 14/23 g1 = (dots[1][1]-dots[0][1]) / (dots[1][0]-dots[0][0]) g2 = (dots[3][1]-dots[2][1]) / (dots[3][0]-dots[2][0]) g3 = (dots[2][1]-dot..
문제 설명 https://school.programmers.co.kr/learn/courses/30/lessons/120923 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 내 풀이 def solution(num, total): answer = [] tmp = 0 for i in range(num): tmp += i start_num = (total-tmp)//num answer = [_ for _ in range(start_num, start_num+num)] return answer x + (x+1) + (x+2) + (x+3) ... = total ..
문제 설명 https://school.programmers.co.kr/learn/courses/30/lessons/120924 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 내 풀이 def solution(common): answer = 0 if common[1] - common[0] == common[2] - common[1]: # 원소 (1-0) = (2-1)이면 등차수열 answer = common[-1] + (common[1] - common[0]) else: # 등비수열 answer = common[-1] * (common[1] // common..
문제 설명 https://school.programmers.co.kr/learn/courses/30/lessons/120880 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 풀이 처음에는 주어진 수(n)와의 거리를 계산하여 이리저리 정렬하고 인덱스를 통해 값을 가져오려 했다... 근데 생각보다 잘 풀리지 않아 다른사람의 풀이를 참고했는데, 놀라웠다! def solution(numlist, n): # 거리가 n에 가까운 순으로 정렬, 절댓값이 같으면 양수(= 큰 값) 먼저 answer = sorted(numlist,key = lambda x : (abs(x..
3. 기술통계 정량적 데이터 분석이란? : 숫자로 표현되는 수치 데이터를 이용해 주어진 데이터를 분석 -> 통계 수치 이용 평균, 중앙값, 최빈값 -> 어느 값을 중심으로 뭉쳐있는지 분산, 표준편차, 분위수 -> 어떤 형태로 퍼져있는가 * 기술통계 함수들에서 ( skipna=False )로 설정 시 NaN 값이 있는 column은 NaN 값으로 출력됨 4. 가설검정 통계적 추청 : 모집단의 모수를 표본들의 통계값을 이용해서 추정하는 방법 - 점추정: 모집단의 특성을 단일한 값으로 추청 - 편향(Bias): 추정량의 기댓값과 모수의 차이 - 평균제곱오파(MSE): 편차 제곱에 대한 기댓값 최대우도 추정량(MLE, Mazimum likelihood..
1. 확률과 확률변수 통계학 : 여러 사건들을 수학적으로 모델링하고 이를 분석하는 것이 통계학의 본질. - 사건은 근복적으로 발생하기 전에 알 수 없으므로 불확실성 내포 -> 이를 표현할 수단이 확률 (ex. 동전 던지기) experiment: 동전을 던지는 행위 sample: 실험의 결과 sample space: 실험으로 발생하는 모든 sample의 집합 events: sample space의 부분집합. 어떤 조건을 만족하는 특정 표본점들의 집합 확률 : 실험을 실시했을 때 나올 수 있는 모든 경우의 수(sample space) 내에서 특정 사건이 발생하는 비율 - 사건 A가 발생할 확률은 [0, 1] 사이의 값을 가진다. - Sample s..
1. 데이터 분석을 해야하는 이유 FAANG(Facebook, Apple, Amazon, Netflix, Google) 중 애플을 제외한 모든 기업은 제조업이 아닌 서비스 기업임 -> 이들은 도대체 무엇을 판매하여서 돈을 벌었을까? ==> 데이터를 이용한 가치! * 아마존: 데이터 분석을 이용한 예측배송 서비스 구글, 페이스북: 데이터 분석을 이용한 온라인 광고 서비스 넷플릭스: 데이터 분석을 이용한 콘텐츠 추천 서비스 데이터 분석이란? - 데이터를 정리, 변환, 조작, 검사를 하여 인사이트를 만들어내는 작업 - 데이터 분석으로 무엇을 할 수 있는가? 왜 해야하는가? - 의사결정의 판단 기준이 주관적인 직감에서 객관적인 데이터로! => 주어진 ..
문제 설명 https://school.programmers.co.kr/learn/courses/30/lessons/298517 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 내 풀이 SELECT ID, LENGTH FROM FISH_INFO ORDER BY LENGTH DESC, ID ASC LIMIT 10; 쉬운 문제이다. 길이가 긴 물고기 10마리를 출력하는 것이기 때문에 일단 조건에 맞게 길이, ID로 정렬을 하고 LIMIT를 통해 10개만 출력한다.
_알파카
yeonnys' 개발일지