중간에 다른 프로젝트를 진행하기도 하고, 강의 위주를 진행하느라 프로젝트에 큰 시간을 쏟지는 않았지만,지금 수강하고 있는 부트캠프(데브코스)의 최종 프로젝트를 앞두고2번의 주제를 갈아엎었으며, 약 2달 정도 주제 선정 과정을 겪었다. 첫 번째 주제는 음악 추천 서비스 제작이었다. 애초에 팀이 모였던 이유가 하나의 서비스를 만들어서 실제 사용자들에게 배포를 해보고, 그 사용자들의 만족도, 로그 데이터 등을 수집하여 정말 실제 사용자들의 분석을 해보고 싶었기 때문이었다. 그러나, 프로젝트를 기획하다보니 '데이터 분석' 프로젝트와 거리가 멀었고, 생각보다 데이터 분석이 아닌 추천 시스템 개발에 초점이 맞춰질 것 같았으며, ab 테스트를 진행해보고 싶었는데, 기존 시스템을 개선하지 않고 우리의 자체 웹 사이..
프로젝트
총 정리 1. 주요 선호 여행지에 더 많은 컨텐츠 제공을 통한 구매율 증가 회사 페이지를 구독한 사용자들이 어떤 여행지를 선호하는지 확인해보자. Beach와 Historical site에 큰 관심이 있는 것으로 보인다. 다음달에 구매할 것으로 예상되는 사용자들의 선호지역과 회사 페이지 구독 여부를 확인해보자. 단순 여행 선호지와 다르게, Financial에서 더 강하게 구독여부와 구매여부가 연관되어 있음을 확인할 수 있다. 따라서, 회사 페이지를 구독했다고 실제 구매까지는 잘 이루어지지 않았다는 것을 알 수 있다. 구독자 유치와 사용자의 선호도를 만족하기 위해 주요 선호지(Beach, Financial, Historical site)의 컨텐츠를 더 준비할 필요가 있다. 2. 다수가 사용하는 기기를 대비한..
이전 글들에 이어 내 파트의 분석 결과를 정리하여 글로 써보겠다. 일단, 내가 잘못 이해하고 있던 것이 있었다! Taken_Product 컬럼은 사용자가 여행상품을 샀는지 여부가 아닌, 사용자가 다음달에 여행상품을 살 것인지를 예측한 값을 나타내는 컬럼이다. 따라서 현재 존재하는 모든 컬럼은 이미 여행상품을 구매한 사용자이고, yearly_avg_Outstaion_checkins 컬럼은 사용자가 연간 평균적으로 외부 지역에 체크인 한 횟수를 의미한다. 생각해보면 당연한 것인데 간과하고 있었던 것인듯 하다. 아무튼, 이를 바탕으로 다시 분석을 해보았다. 이번 글은 체크인 횟수를 바탕으로 여러가지 컬럼과 함께 태블로 상에서 시각화를 해보도록 하겠다. 먼저, 다음달에 여행 상품을 구매할 것으로 예측되는 사람들..
저번 1차 분석을 바탕으로 심화 분석을 진행해보자. 2024.03.11 - [프로젝트] - 관광회사 고객 행동 데이터 분석 (1) 관광회사 고객 행동 데이터 분석 (1) 캐글에서 제공해주는 데이터셋을 SQL으로 분석해보자! 분석하고자 하는 데이터셋은 아래에서 구하였다. https://www.kaggle.com/datasets/ddosad/customer-behaviour-tourism-portal/data Tourism Page Engagement Explore User Pat yeonnys.tistory.com 체크인 수 컬럼을 중점으로 데이터를 분석해 볼 예정이다. 외부 지역에 체크인을 한 횟수는 곧 여행 횟수라고 할 수 있다. (물론, 한 번의 여행에 오랜 기간을 여행하여 체크인 수가 커졌을 수도 ..
캐글에서 제공해주는 데이터셋을 SQL으로 분석해보자! 분석하고자 하는 데이터셋은 아래에서 구하였다. https://www.kaggle.com/datasets/ddosad/customer-behaviour-tourism-portal/data Tourism Page Engagement Explore User Patterns on Social Media Page : EDA & Classification www.kaggle.com 먼저 데이터의 컬럼들을 살펴보자. 총 17개의 컬럼이 존재한다. 컬럼명 설명 UserID 사용자의 고유 식별자 Taken_product 사용자가 여행상품을 샀는지 여부 Yearly_avg_view_on_travel_page 사용자가 연간 평균적으로 여행 관련 페이지를 조회한 횟수 pr..