Project/Python 4

python project 주제 선정 배경

팬데믹 당시 급성장했던 온라인 장보기 시장이, 포스트 코로나로 접어들면서 성장이 예상보다 정체되고 있습니다 현재 저희 기업(instacart)은 위기를 맞이하고 있습니다. 현재 Instacart의 위기 고객 유입 속도 감소와 고객 이탈률 증가, 경쟁사 서비스 업그레이드 및 확장이 증가되고 있습니다.식료품 소매업은 근본적으로 마진이 낮은 사업입니다. 시장이 얼마나 발달했는지 또는 포맷에 따라 EBITDA 마진은 일반적으로 4% 에서 8%이고 EBIT는 순매출의 2% 에서 5%입니다.시장이 확장되고 경쟁이 치열해짐에 따라, 잠재적으로 마진이 압축되고 CAC가 증가함에 따라, 고객 충성도를 보장하기 위해 고객 경험이 중요해질 가능성이 큽니다.(CAC란 ? 고객 한 명을 확보하는 데 들어가는 비용이에요Insta..

Project/Python 2025.03.30

파이썬 데이터 분석 팀 프로젝트 (instacart_kaggle)

미국의 식료품 배달 이커머스 플랫폼 ‘Instacart’의 실제 사용자 구매 기록을 바탕으로 구성된 데이터셋 데이터 셋 설명 데이터명: instacart.csv열(column): 33819106(대략 3천3백만개)행(row): 15출처: kaggle 주요 칼럼과 변수설명 데이터 개요1. 총 주문 기록 수: 약 33,819,106건2. 고유 고객 수 (user_id): 약 206,000명 (정확하게 206209명)3. 고유 상품 수 (product_name): 약 49,000개 (49685개)데이터 일변량 EDA (1차 탐색)Instacart 병합 데이터 (df)를 기준으로 한 변수씩 독립적으로 살펴보는 분석  범주형 변수 EDA ( 이 범주형 데이터가 얼마나 자주 나오는지, 어떤 게 많은지 알아보는 분석..

Project/Python 2025.03.20

(2) 데이터 분석 프로젝트 분야별 데이터 수집 (with Python)

*분석과제가 분명하지 않다면 방향성 제시를 제안 받아야한다 분석해볼만한 과제, 시각화해볼만한 아이디어, 검증해볼만한 가설등을 제안받는다. (1) 이커머스  고객 세그먼트 분석 (구매정보로 고객을 세분화하고 세부 그룹별로 각각에  맞는 프로모션 전략을 수집하고 시행)=RFM분석  ? 여기서 RFM(recency, frequency, monetary) 기법얼마나 최근에 결제했는지, 얼마나 자주 구매했는지, 얼마나 큰 금액을 구매했는지 → RFM분석을 해보고 싶어, 각 customer_id별로 RFM척도를 스코어링 하는 기준을 설명하고, 스코어링해서 고객별 R,F,M 스코어를 시트에 업데이트 해줘  → R,F,M 스코어를 기준으로 고객 세분화를 해보자  1. 세그먼트를 최대한 MCE하게 설계해야해 (전체유저들..

Project/Python 2025.03.20

(1)데이터 분석 프로젝트(파이썬)

데이터 분석의 기본과정과 챗gpt에물어보는 순서   (노란색 형광팬은 gpt에 질문하는 탬플릿)① 데이터 설명하기  :항상  분석하는 데이터를 gpt에 개괄적으로 설명하는 게 좋다 (파일명도 이 파일의 내용과 관계있게 설정해라)  " 이 데이터는 브라질 이커머스 사이트인 olist의 판매 데이터입니다.  이 데이터를 살펴보고 이 데이터에 대해서 한국어로 설명해 주세요 " 이렇게 질문하면 아래와 같은 답변을 얻을 수 있을것이다.  GPT분석이 데이터는 브라질의 이커머스 플랫폼 olist의 주문 데이터를 포함하고 있습니다. 총 99,441개의 주문 정보가 있으며, 8개의 칼럼으로 구성되어 있습니다.데이터 컬럼 설명order_id: 주문의 고유 식별자 (각 주문마다 고유한 값) customer_id: 고객의 ..

Project/Python 2025.03.20