Project/Python

(2) 데이터 분석 프로젝트 분야별 데이터 수집 (with Python)

sYOUNG_DA 2025. 3. 20. 16:06

*분석과제가 분명하지 않다면 방향성 제시를 제안 받아야한다 

분석해볼만한 과제, 시각화해볼만한 아이디어, 검증해볼만한 가설등을 제안받는다. 


(1) 이커머스 

 

고객 세그먼트 분석 

(구매정보로 고객을 세분화하고 세부 그룹별로 각각에  맞는 프로모션 전략을 수집하고 시행)

=RFM분석 

 

? 여기서 RFM(recency, frequency, monetary) 기법

얼마나 최근에 결제했는지, 얼마나 자주 구매했는지, 얼마나 큰 금액을 구매했는지

 

→ RFM분석을 해보고 싶어, 각 customer_id별로 RFM척도를 스코어링 하는 기준을 설명하고, 스코어링해서 고객별 R,F,M 스코어를 시트에 업데이트 해줘

 

→ R,F,M 스코어를 기준으로 고객 세분화를 해보자  

1. 세그먼트를 최대한 MCE하게 설계해야해 (전체유저들을 포괄할 수있게)

2.각 세그먼트를 정의하고, 분류 기준을 설명한 후, 고객들을 세그먼트 별로 분류하세요. 그리고 시트에 세그먼트 이름을업데이트 하세요. 

3. 최종적으로 각 세그먼트별로 고객이 몇 명이 포함되었는지 설명해주세요. 

 

고객을 이탈고객, 충성고객, 휴먼고객등...으로 고객 아이디별로 세분화 해준다

(추출한 아이디를 바탕으로 타겟 마케팅이 가능해진다.) 

 

액션플랜 프롬프트 

#role 

당신은 이커머스 프로모션 전략가 입니다. CPM에 대한 깊은 이해를 바탕으로 고객 맞춤형 프로모션 전략을 수집하고 실행하는데 전문성을 가지고 있습니다. 

 

#Objective 

고객 세그먼트별 맞춤형 프로모션 액션 플랜 아이디에이션 해주세요. 각 세그먼트 별로 3가지씩 구체적이고 바로 실행 가능한 액션플랜을 제안해주세요. 

 

1단계: 데이터 수집 및 전처리

목표: 데이터셋을 불러오고, 정리하며, 분석이 가능한 형태로 가공하기

🔹 해야 할 일

✅ Kaggle에서 이커머스 판매 데이터 및 마케팅 A/B 테스팅 데이터를 다운로드
Pandas를 이용해 CSV/Excel 파일을 불러오기
✅ 결측치(NaN) 확인 및 처리
✅ 데이터 타입 확인 및 변환 (예: 날짜 데이터 datetime 변환)
✅ 필요 없는 컬럼 삭제 또는 정리

 

2단계: 데이터 분석 및 시각화

목표:  Python을 활용하여 데이터에서 의미 있는 인사이트를 찾기

🔹 해야 할 일

이커머스 분석
🔹 월별 매출 트렌드 분석 (SQL 또는 Pandas 활용)
🔹 가장 많이 팔리는 제품 및 카테고리 분석
🔹 고객 세그멘테이션 (연령대별, 지역별, 구매 패턴 분석)
🔹 SKU별 판매 속도 및 재고 관리 최적화

마케팅 A/B 테스트 분석
🔹 SQL 또는 Python을 사용하여 A/B 그룹 나누기
🔹 광고 클릭률(CTR) 비교 → Conversion Rate = Clicks / Impressions
🔹 이메일 마케팅 효과 분석 (메일 제목별 전환율 비교)
🔹 할인 쿠폰이 구매로 이어지는지 분석

 

3단계: 인사이트 도출 및 보고서 작성

목표: 데이터 분석 결과를 바탕으로 비즈니스 전략을 제안

🔹 해야 할 일

매출 분석 결과 요약

  • 가장 매출이 높은 달은 언제인가?
  • 어떤 제품 카테고리가 가장 인기 있는가?
  • 재고 관리에서 문제점이 있는 SKU는 무엇인가?

마케팅 A/B 테스트 결과 요약

  • 광고 클릭률이 높은 그룹은?
  • 이메일 제목 중 어떤 것이 가장 전환율이 높았는가?
  • 할인 쿠폰이 실제 구매로 이어졌는가?

Tableau / Power BI로 대시보드 제작

  • 월별 매출 그래프
  • 제품별 판매량 상위 10개 바 차트
  • A/B 테스트 그룹별 전환율 비교 바 차트

최종 보고서 작성 (추천 포맷) 1️⃣ 프로젝트 개요 – 어떤 문제를 해결하려고 했는가?
2️⃣ 사용한 데이터 & 분석 기법 – SQL, Python, Tableau 활용
3️⃣ 주요 분석 결과 (인사이트 요약)
4️⃣ 비즈니스 전략 제안 (액션 플랜)

🔹 예시 (보고서 요약)

1️⃣ 매출 분석 결과

  • 7월~9월 매출이 가장 높음 (여름 시즌 할인 효과)
  • 스포츠화 카테고리가 전체 매출의 40% 차지
  • SKU #1002는 가장 많이 팔렸지만 재고 부족 문제 발생

2️⃣ 마케팅 A/B 테스트 결과

  • A 그룹 (기존 광고) CTR: 2.1%, B 그룹 (새로운 광고) CTR: 3.4%
    새로운 광고 전략이 효과적이므로 B 그룹 방식을 전체 적용 추천
  • 이메일 제목 "50% 할인 쿠폰 제공!"이 가장 높은 전환율 기록

3️⃣ 비즈니스 전략 제안

  • 스포츠화 카테고리에 대한 광고 예산을 20% 증액
  • 재고 부족 SKU는 AI 예측을 활용해 공급망 최적화
  • 광고 A/B 테스트 결과를 기반으로 B 광고 캠페인을 확대 적용

(2) 유저 데이터 분석 

:유저가 우리 서비스에 들어와서 어떤 액티비티를 하는지 row 데이터를 추출해서 인사이트를 뽑는 방식 

 

(3) 주가 데이터 분석 

-A관련된 이벤트이후 마이크로 소프트  주가에 어떤 영향을 미쳤는지 분석 

-마이크로 주가와 관련된 A의 주요 이벤트를 리스트업 해줘 (인터넷을 기반으로 검색하되 큰 이벤트, 정말 중요한 이벤트에 한해서 10개 이내로 리스트업 해줘) 

-리스트업한 이벤트중 발생한 날짜와 해당 날짜 근처의 마이크로 소프트주가 종가 데이터를 비교해서 A의 이벤트가 이 주가에 영향을 줬는지 분석해줘 

- 이를 한눈에 볼 수있게 라인차트로 시각화해, 해당 이벤트 전후로 종가가 어떻게 변동했는지 보고싶어. 

 

(*여로 sub-task를 하나의 프롬프트에 요청할 때 Let's think step by step이라고 하면 더 좋아짐)