전체 글

안녕하세요, 데이터 분석가를 꿈꾸는 개인기록 블로그입니다:)
4-1. 퀴즈 리뷰 생략 4-2. Gen AI란? _ 첫번째 인공지능, 머신러닝, 딥러닝 - 인공지능 : 인간이 하는 일을 대신 해주는 시스템을 만드는 컴퓨터 과학 - 머신러닝 : 인공지능의 일부 -> 데이터에서 패턴을 찾는 블랙박스 - 딥러닝 : 머신러닝의 일부 -> 이미지/비디오/오디오 등의 복잡한 데이터 처리에 강점 -> 개념은 오래전부터 있었으나 빅데이터, 클라우드의 발전으로 떠오르게 됨 Gen AI ( Generative AI )란? - Gen AI는 학습된 컨텐츠를 바탕으로 새로운 컨텐츠를 만드는 딥러닝 기술 -> 입력 컨텐츠의 내용을 학습한 모델이 만들어짐 ( ex. GPT) ex. 자연스러운 언어 문장 데이터로부터 새로운 문장을 만들어냄! ex. 본래 ..
· EXCEL
Google Sheet를 이용해 지표를 정의하고 차트를 만들어보자! Google Sheet란? - 구글의 스프레드시트를 의미한다. Microsoft Excel에 대응하여 구글에 만든 웹 기반 서비스로, 인터넷 연결만으로도 사용할 수 있으며, 기본적으로 Microsoft(MS) Excel과 비슷한 인터페이스를 가지고 있다. 장점 : 행과 열의 개수 제한, 그리고 속도를 제외한다면 가장 데이터베이스에 적합한 프로그램은 Microsoft사의 Excel이 아닌 구글 스프레드시트가 될 정도로 강력한 기능이 많고 웹과 온라인 특성에서 가져올 수 있는 강점을 보인다. -> 협업과 자동화, (스몰) 데이터 관리에 있어 효율적이다. : 구글 드라이브에 연동하여 쉽게 공뷰할 수 있으며, 웹 주소를 공유해 공동 작업이 가능..
머신러닝을 기반으로 한 제품 개선이 무엇인지 알아보자! 3-1. 데이터 기반 제품 개선(Product Science)이란? : 머신러닝 기술을 사용해 제품/서비스의 기능을 개선하는 것에 대해 살펴보자. 데이터 과학자의 역할(Product Science) - 머신러닝 형태로 사용자들의 경험을 개선 : 중요한 문제를 정의(가설 정의) -> 데이터 수집(머신러닝 모델에 따라 수집방법이 달라짐) -> 예측 모델 생성 -> 테스트 (테스트는 훈련데이터의 일부를 사용 / A.B 테스트를 수행하는 것이 좋음) (짧은 사이클로 단순하게 시작해서 고도화하는 것이 좋음 -> 에자일 방법론) 데이터 과학자에게 필요한 스킬셋 : ML/DL에 대한 깊은 지식과 경험 : 코딩 능력(파이썬, ..
태블로는 데이터를 기반으로 계산/분석/표시하기 위한 시각화 툴이다. 즉, 데이터를 시각화해주는 기구라고 생각하면 된다. 이 때, 시각화 툴은 대시보드 혹은 BI(Business Intelligence) 툴 이라고도 불린다 즉, 시각화 툴은 사람들이 중요한 정보를 쉽게 볼 수 있도록 하는 툴이다! 이는 결정권자들이 데이터 기반 의사결정을 쉽게 할 수 있도록 도와주며, 데이터 분석을 쉽게 할 수 있도록 도와준다. 대표적인 시각화 툴 - Excel, Google Spreadsheet - Python - Looker - Tableau - Power BI - Apache Superset - Mode Analytics, ReDash - Google Studio - AWS Quicksight 현업에서 가장 많이 사용..
2-1. 데이터 문해력 퀴즈 리뷰 생략 2-2. 데이터 기반 의사 결정(Decision Science)이란? 두 가지 형태의 데이터 기반 의사 결정이 있음 데이터란 기본적으로 과거의 기록이므로 이를 바탕으로 한 결정은 최적화에 가까움! 1) Data Driven Decision 2) Data Informed Decision 데이터에서 인사이트 찾기 : 중요 지표를 데이터 기반으로 정의하고 시각화하기 : 가설을 바탕으로 실제 데이터를 보고 확인하기 -> A/B Test 데이터 분석 케이스들 - 중요 지표 대시보드 만들기 - 고객 이탈률 분석: 보통 코호트(동일한 특성을 갖는 고객 그룹) 분석 -> ex) 처음으로 서비스를 시작한 날짜를 기준 - 고객 잔존률 분석: 보통..
1. 데이터 문해력이란? 1-1. 데이터란? 데이터란 우리 생활 모든 곳에 존재하며, 우리가 관찰할 수 있는 모든 것을 말함 ex) 온도, 풍향, 소리 등.. -> 의미있는 정보 도출 가능 -> 데이터를 활용하는 것의 시작은 데이터를 기록하고 수집하는 것임(Digitization) => 웹, 모바일과 같은 모바일 환경에서 데이터를 수집. 요즘은 클라우드, 빅데이터 처리. 인공지능의 기술 발전으로 인해 점점 더 많은 오프라인 서비스 혹은 오프라인 -> 온라인의 트렌드가 만들어짐 빅데이터란 꼭 크기가 큰 데이터만을 의미하는 것이 아님 데이터에서 가장 중요한 것은 품질. 그 다음이 크기임. 품질이 좋아야 좋은 데이터임. 빅데이터의 예) 모바일 디바이스의 위치정보, 스마트TV, IoT 센터, 센서 데이터, 웹 ..
· 일기
드디어 기초 100문제를 완료했다! 사실 시작은 12월 10일인데.. 중간에 여러가지 여행 및 새로운 일들이 많이 생겨 꾸준히 풀지는 못했다. 사실 옆에서 응원해주는 친구가 없었다면 다 못했을 것 같다. 내가 원하는 직무인 데이터 분석이란 직무가 다른 개발자에 비해 알고리즘 역량이 많이 중요하지는 않지만.. 없어서 나쁠 것은 없으므로 꾸준히 풀고 싶다. 언젠가 내가 어떤 기업에 들어갈 때 코딩테스트가 내 발목을 잡는 무언가가 되질 않길 바란다. 기초 문제였지만 중간중간 많이 어려운게 많았다. 소중한 사람이 없었더라면 끝까지 완수하지 못했을 것 같다.
드디어 기초 문제의 마지막 문제이다! ❤❤ 정답률이 45%인 문제이다ㅠㅠ 그래도 한 번 풀어보자! 문제 설명 https://school.programmers.co.kr/learn/courses/30/lessons/181832 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 내 코드 결국 못풀어서 도움을 받아 풀었다ㅠㅠ 넘 어려운 문제다ㅠㅠ 역시 정답률 45%....... 우울하담ㅠㅠ def solution(n): dy = [0,1,0,-1] # 오른,아래,왼,위 dx = [1,0,-1,0] arr = [ [0 for x in range(n)] for _ i..
문제설명 https://school.programmers.co.kr/learn/courses/30/lessons/181836 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 내 풀이 def solution(picture, k): answer = [] # 각 픽셀(" ") 순회 for p in picture: # 가로로 증가된 값을 mul에 저장 mul = '' # " "안의 값을 순회(ex. "x.x") for x in range(len(p)): # p[0]은 x, p[1]은 ., p[2]는 x가 됨 # p[0]을 k배 한 값을 mul에 저장 # mul에는..
문제설명 https://school.programmers.co.kr/learn/courses/30/lessons/181830# 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 처음 풀이(틀림!) def solution(arr): # 행의 수 col = len(arr) # 열의 수 row = len(arr[0]) # 행과 열 중 큰 수를 num에 저장 num = col if col > row else row # num이 행의 수보다 크면.. 열의 수가 더 많으므로, 모자란 행(큰 수 - 행 수)을 추가함. 이 때, 추가하는 행의 원소 개수는 큰 수(열의 개수..
_알파카
yeonnys' 개발일지