📅 2026.04.13–14 | 📚 데이터분석개론 Day 8–9
[TIL] Day8–9 | 데이터분석개론
유튜브 댓글 분석 + MCP & 프롬프트 엔지니어링
Day 8 — 유튜브 댓글 실습
💡 Day 8 한 줄 요약
YouTube API로 댓글을 수집하고, 전처리 → 키워드 분석 → 감성 분류까지 이어지는 텍스트 분석 파이프라인을 직접 구현했다.
YouTube API로 댓글을 수집하고, 전처리 → 키워드 분석 → 감성 분류까지 이어지는 텍스트 분석 파이프라인을 직접 구현했다.
앞서 배운 Pandas 전처리 기법을 실제 소셜 데이터에 적용하는 파트입니다. 댓글 데이터는 HTML 태그, 이모지, 오탈자 등 다양한 노이즈가 섞여 있어 전처리 과정이 핵심입니다.
유튜브 댓글 분석 전체 흐름 — 5단계 파이프라인
YouTube API 키 발급
🔑 API 키 = 비밀번호! 절대 외부에 공유하거나 GitHub에 올리지 마세요.
- https://console.cloud.google.com 접속 → 새 프로젝트 만들기
- API 및 서비스 → 라이브러리 → "YouTube Data API v3" → 사용 설정
- 사용자 인증 정보 → API 키 만들기 → 복사
from googleapiclient.discovery import build
API_KEY = "여기에_API_키_입력"
VIDEO_ID = "분석할_영상_ID" # URL의 v= 뒤 값
youtube = build("youtube", "v3", developerKey=API_KEY)
print("YouTube API 연결 완료!")
Step 1 raw 응답 먼저 눈으로 보기
API를 쓸 때 가장 중요한 원칙: 응답이 어떻게 생겼는지 먼저 확인하기
구조를 모른 채 값을 꺼내려 하면 KeyError만 반복하게 됩니다.
구조를 모른 채 값을 꺼내려 하면 KeyError만 반복하게 됩니다.
import json
response = youtube.videos().list(
part="snippet,statistics",
id=VIDEO_ID
).execute()
# raw JSON 전체 구조 확인 ← 항상 먼저 하기!
print(json.dumps(response, indent=2, ensure_ascii=False))
YouTube API 응답의 중첩 딕셔너리 구조 — response['items'][0]['statistics']['viewCount'] 처럼 단계별로 꺼냅니다
video = response['items'][0]
title = video['snippet']['title']
views = video['statistics']['viewCount']
likes = video['statistics']['likeCount']
n_comm = video['statistics']['commentCount']
print(f"조회수: {int(views):,} / 좋아요: {int(likes):,} / 댓글: {int(n_comm):,}")
Step 2 댓글 → DataFrame 변환
댓글 구조 경로: items → snippet → topLevelComment → snippet
response_comm = youtube.commentThreads().list(
part="snippet", videoId=VIDEO_ID, maxResults=50
).execute()
rows = []
for item in response_comm['items']:
c = item['snippet']['topLevelComment']['snippet']
rows.append({
'author': c['authorDisplayName'],
'text': c['textDisplay'],
'likes': c['likeCount'],
'date': c['publishedAt'][:10]
})
yt = pd.DataFrame(rows)
print(f"댓글 {len(yt)}개 수집 완료")
Step 3 텍스트 전처리
| 함수 | 하는 일 |
|---|---|
| str.replace('A', 'B') | 문자열 교체 |
| str.strip() | 앞뒤 공백 제거 |
| str.len() | 문자열 길이 계산 |
# HTML 태그 제거 + 공백 정리
yt['text_clean'] = yt['text'].str.replace('<br>', ' ', regex=False).str.strip()
# 댓글 길이 파생변수 + 짧은 댓글(이모지 전용) 제거
yt['text_len'] = yt['text_clean'].str.len()
yt_filtered = yt[yt['text_len'] > 5].copy()
💡 "😊"나 "❤️" 같은 이모지 전용 댓글은 서비스 의견이 없습니다. 이런 댓글이 포함되면 감성 분석 결과가 왜곡되므로 분석 목적에 맞는 댓글만 남기는 것이 전처리의 핵심입니다.
Step 4 날짜 처리
yt_filtered['date'] = pd.to_datetime(yt_filtered['date'])
yt_filtered['month'] = yt_filtered['date'].dt.month
# 월별 댓글 수
print(yt_filtered.groupby('month')['text'].count())
날짜를 datetime으로 바꿔야 월/연도 추출이 가능합니다. 문자열 상태에서는 "2025-01"과 "2025-02"를 순서대로 비교하거나 집계할 수 없습니다.
Step 5 서비스 언급 분석 — Share of Voice
services = ['멜론', '스포티파이', '유튜브뮤직', '애플뮤직', '지니', '타이달']
mention_counts = {}
for svc in services:
mention_counts[svc] = yt_filtered['text_clean'].str.contains(svc, na=False).sum()
print(pd.Series(mention_counts).sort_values(ascending=False))
언급 횟수는 브랜드 인지도(Share of Voice)의 간이 측정입니다. 경쟁사 대비 얼마나 자주 거론되는지, 어떤 맥락인지를 파악할 수 있습니다.
Step 6 이탈/전환 패턴 분석
churn_keywords = '옮겼|갔다|넘어|바꿨|관뒀|갈아탔'
df_churn = yt_filtered[
yt_filtered['text_clean'].str.contains(churn_keywords, na=False)
]
print(f"전환 언급 댓글: {len(df_churn)}개")
print(df_churn[['author', 'text_clean', 'likes']].to_string())
전환 패턴을 보면 어느 서비스에서 이탈해서 어디로 가는지 흐름이 보입니다. 우리 서비스의 약점(떠나는 이유)과 기회(오는 이유)를 동시에 파악할 수 있습니다.
Step 7 페인포인트(불만) 분석
pain_dict = {
'UI불편': 'UI|불편|무거|극혐|별로',
'음질문제': '음질|무손실',
'콘텐츠부족': '없는|음원풀|부족',
'가격문제': '해외결제|비싸|무료',
}
for category, keywords in pain_dict.items():
count = yt_filtered['text_clean'].str.contains(keywords, na=False).sum()
print(f"{category}: {count}건")
카테고리별로 정량화하면 "불만이 많다"는 감상이 아니라 "UI 불만 8건 > 음질 불만 3건"처럼 우선순위를 정할 수 있습니다.
Step 8 감성 분류
positive_kw = '좋아|최고|추천|편리|개꿀|짱'
negative_kw = '불편|별로|극혐|짜증|없는|막혀|관뒀'
yt_filtered['sentiment'] = '중립'
yt_filtered.loc[yt_filtered['text_clean'].str.contains(positive_kw, na=False), 'sentiment'] = '긍정'
yt_filtered.loc[yt_filtered['text_clean'].str.contains(negative_kw, na=False), 'sentiment'] = '부정'
print(yt_filtered['sentiment'].value_counts())
이 방식은 키워드 기반 감성 분류입니다. 딥러닝 없이 빠르게 결과를 낼 수 있으며, 키워드를 정교하게 다듬으면 실무에서 충분히 활용 가능합니다.
Step 9 좋아요 분석 — 다수가 공감한 댓글
print(yt_filtered['likes'].describe())
top5 = yt_filtered.nlargest(5, 'likes')[['author', 'text_clean', 'likes']]
print(top5)
TOP 댓글을 먼저 읽으면 전체를 다 읽지 않아도 핵심 여론을 빠르게 파악할 수 있습니다.
📎 Day 8 치트시트
| 함수 | 하는 일 |
|---|---|
| df.isnull().sum() | 결측치 개수 |
| df['col'].fillna(값) | 결측치 채우기 |
| df.dropna(subset=['col']) | 결측 행 제거 |
| df['col'].quantile(0.75) | 상위 75% 값 (Q3) |
| pd.cut(col, bins, labels) | 숫자를 구간으로 나누기 |
| df.groupby('col').agg({...}) | 그룹별 집계 |
| str.contains('키워드') | 문자열 포함 여부 |
| pd.to_datetime(col) | 날짜 타입 변환 |
| df['date'].dt.month | 날짜에서 월 추출 |
| df.nlargest(n, 'col') | 값이 큰 상위 n행 |
| df.loc[조건, '컬럼'] = 새값 | 조건부 값 수정 |
| df.iloc[-N:] | 마지막 N행 |
Day 9 — MCP 데이터 연동 & 프롬프트 엔지니어링
💡 Day 9 한 줄 요약
MCP로 Claude가 내부 DB에 직접 접근할 수 있게 됐고, 어떻게 질문하느냐(프롬프트 엔지니어링)가 분석 결과의 질을 10배 이상 바꾼다.
MCP로 Claude가 내부 DB에 직접 접근할 수 있게 됐고, 어떻게 질문하느냐(프롬프트 엔지니어링)가 분석 결과의 질을 10배 이상 바꾼다.
| 도구 | 역할 | 한 줄 설명 |
|---|---|---|
| uv / uvx | Python 실행 환경 관리 | MCP 서버를 실행하는 런처 |
| Claude Desktop | MCP Host 앱 | Claude + MCP 연결 창구 |
| MCP 서버 (MySQL) | 외부 DB 연결 브릿지 | 자연어 → SQL 번역기 |
한 줄 요약: uvx가 MCP 서버를 실행하고, Claude Desktop이 그 서버와 연결해서 MySQL 같은 DB에 접근합니다. 마케터는 Claude Desktop에서 자연어로 질문만 하면 됩니다.
왜 uv가 필요한가? — pip의 한계
| 문제 | 실제 상황 | uv의 해결 |
|---|---|---|
| 의존성 충돌 | A패키지는 numpy 1.x, B패키지는 numpy 2.x → 동시 설치 불가 | 프로젝트별 격리 환경 자동 관리 |
| 느린 설치 | ML/데이터 패키지는 설치가 느려 개발 흐름 끊김 | Rust 기반으로 pip 대비 10~100배 빠름 |
| 글로벌 오염 | 시스템 Python에 패키지 누적 → 버전 충돌 | 프로젝트 단위 완전 격리 |
uvx를 MCP 서버에 쓰는 이유
| # | 이유 | 설명 |
|---|---|---|
| ① | 글로벌 오염 없음 | 각 MCP 서버가 격리 환경에서 실행 — 서버끼리 충돌 없음 |
| ② | 설치 단계 없음 | Claude Desktop 시작 시 uvx가 자동으로 MCP 서버 실행 |
| ③ | 자동 최신 버전 | 기본적으로 최신 버전 패키지 사용 — 버그 수정 자동 반영 |
| ④ | 크로스 플랫폼 | macOS, Windows, Linux 어디서든 동일 명령어 |
🌐 Claude.ai (웹)
MCP 서버 연결 ❌로컬 DB 직접 분석 ❌
로컬 파일 접근 ❌
🖥️ Claude Desktop (앱)
MCP 서버 연결 ✅로컬 DB 직접 분석 ✅
로컬 파일 접근 ✅
1. MCP란 무엇인가
등장 배경 — Before vs After
❌ 기존 방식
1. 마케터가 궁금한 것이 생김2. 데이터팀에 슬랙/지라로 요청
3. 2~5일 대기
4. 결과 받음 → 맥락이 이미 사라짐
5. 추가 드릴다운 → 다시 요청
6. 의사결정 지연, 기회비용 발생
✅ MCP + Claude 방식
1. 마케터가 궁금한 것이 생김2. Claude에게 자연어로 바로 질문
3. 30초~2분 내 결과 + 인사이트
4. 바로 드릴다운 추가 질문
5. 실시간 가설 검증 가능
6. 즉각적인 의사결정 가능
| 작업 | 기존 방식 | MCP + Claude |
|---|---|---|
| 캠페인 성과 조회 | 1~2일 | 1분 |
| 코호트 리텐션 분석 | 3~5일 | 5분 |
| 이상 탐지 | 주 1회 리포트 | 실시간 |
| A/B 테스트 결과 분석 | 2~3일 | 10분 |
| 세그먼트 발굴 | 1주일+ | 30분 |
MCP(Model Context Protocol) 정의
Anthropic이 2024년 11월에 오픈소스로 공개한 표준 프로토콜.
AI 모델이 외부 데이터 소스/도구/서비스에 안전하게 연결될 수 있도록 설계된 개방형 표준.
"AI를 위한 USB-C 포트"라고 불립니다. — LLM이 여러 외부 프로그램과 통신하기 위한 표준 프로토콜
AI 모델이 외부 데이터 소스/도구/서비스에 안전하게 연결될 수 있도록 설계된 개방형 표준.
"AI를 위한 USB-C 포트"라고 불립니다. — LLM이 여러 외부 프로그램과 통신하기 위한 표준 프로토콜
자연어 질문이 SQL로 자동 변환되어 DB에 실행되는 전체 흐름
MCP가 지원하는 기능 3가지
| 기능 | 정의 | 그로스 마케팅 활용 |
|---|---|---|
| Resources | AI가 읽을 수 있는 데이터/파일 | 캠페인 데이터, GA 리포트 읽기 |
| Tools | AI가 실행할 수 있는 함수/액션 | SQL 쿼리 실행, Slack 알림 발송 |
| Prompts | 재사용 가능한 프롬프트 템플릿 | 주간 KPI 리포트 자동화 |
보안 고려사항 — 실무 도입 전 반드시 체크
🔒 필수 보안 체크리스트
- 읽기 전용(Read-Only) 계정: SELECT 권한만 부여. INSERT/UPDATE/DELETE 절대 허용 금지
- 개인정보 마스킹: 이름, 이메일, 전화번호 등 PII는 DB 뷰(View)로 마스킹 처리 후 연결
- 민감 데이터 분리: 결제 정보, 의료 정보 등 민감 테이블은 별도 DB에 격리
- VPN/내부망 설정: MCP 서버는 외부 인터넷에 노출하지 않고 내부망에서만 운영
- Claude.ai 유료 플랜: Team/Enterprise 플랜은 대화 내용을 학습에 사용하지 않음
2. 프롬프트 엔지니어링 4가지 핵심 구성요소
같은 데이터를 보면서도 어떻게 질문하느냐에 따라 결과물의 품질이 10배 이상 달라집니다.
이 4가지를 갖출수록 Claude의 분석 결과가 10배 이상 달라집니다
| 요소 | 설명 | 예시 |
|---|---|---|
| 역할 (Role) | 전문가 역할 설정 | "너는 10년 경력의 그로스 마케터야" |
| 맥락 (Context) | 비즈니스 상황 설명 | "B2C SaaS, MAU 5만, 현재 리텐션이 핵심 문제" |
| 작업 (Task) | 정확한 요청 명시 | "월별 코호트 리텐션 계산하고 이탈 패턴 분석" |
| 형식 (Format) | 결과물 형태 지정 | "표 형식으로 정리하고 핵심 인사이트 3줄 요약" |
3. 프롬프트 패턴 5가지
패턴 1: 드릴다운 패턴
큰 그림에서 시작해 점점 구체적인 원인을 파고드는 패턴.
1단계: "지난달 채널별 신규 유저 획득 수와 CAC를 보여줘"
2단계: "페이스북 CAC가 가장 높네. 캠페인별로 쪼개줘"
3단계: "campaign_id 203의 CPA가 왜 높은지 소재/타겟별로 분석해줘"
4단계: "이 분석을 바탕으로 예산 재배분 방안을 3가지 제안해줘"
패턴 2: 가설 검증 패턴
이미 가설을 갖고 있을 때 데이터로 검증하는 패턴.
"내 가설은 [주말 가입 유저가 평일 가입 유저보다 30일 리텐션이 낮다]야.
1) 가입 요일별 30일 리텐션 비교
2) 통계적으로 유의미한지 판단
3) 맞다면 원인 가설 3가지, 틀리다면 실제로 영향을 주는 변수 찾아줘"
패턴 3: 비교 분석 패턴
두 개 이상의 그룹/기간/채널을 비교할 때 사용.
"그룹 A(쿠폰 첫 구매) vs 그룹 B(정가 첫 구매) 비교해줘.
비교 항목: LTV 90일, 재구매율, 평균 주문금액, 리텐션 곡선
마지막에 어떤 그룹이 비즈니스에 더 가치 있는지 판단해줘"
패턴 4: 이상 탐지 패턴
KPI가 갑자기 변했을 때 원인을 빠르게 찾는 패턴.
"어제 DAU가 전주 동요일 대비 23% 하락했어.
1) 신규/기존 유저 중 어디서 하락했는지
2) 특정 채널, 디바이스, 지역에서 집중됐는지
3) 특정 기능/페이지 사용이 줄었는지
가장 가능성 높은 원인을 우선순위로 정렬해줘"
패턴 5: 예측 & 시뮬레이션 패턴
현재 트렌드 기반 미래 예측 또는 전략 효과 시뮬레이션.
"현재 데이터를 기반으로:
1) 이번 달 말 MRR 예측 (현재 성장률 유지 시)
2) 리텐션을 5%p 개선하면 6개월 후 MRR 변화
3) CAC를 20% 줄이면 같은 예산으로 몇 명을 더 획득할 수 있는지
각 시나리오를 표로 정리해줘"
4. 실전 프롬프트 예시 20개
실습 데이터셋 기준으로 바로 실행 가능한 프롬프트입니다.
예시 01 — 채널별 신규 유저 획득 현황
목적: 어떤 채널이 가장 효율적으로 유저를 데려오는지 파악
"지난 3개월간 채널(utm_source)별 신규 가입자 수, 전체 대비 비율, 월별 트렌드를 보여줘. 가장 성장하는 채널과 감소하는 채널을 각각 1개씩 찾아줘."
💡 월별 트렌드까지 요청하면 계절성/캠페인 효과를 동시에 파악 가능
예시 02 — 퍼널 단계별 전환율 분석
목적: 가입 → 온보딩 → 첫구매 퍼널에서 가장 큰 이탈 구간 찾기
"가입 → 프로필 완성 → 첫 주문 → 두 번째 주문 퍼널을 분석해줘. 각 단계 전환율과 평균 소요 시간을 채널별로 비교하고, 가장 이탈이 많은 구간의 개선 방안 2가지를 제안해줘."
💡 "평균 소요 시간" 추가가 핵심 — 3일 후 이탈 vs 30분 내 이탈은 원인과 해결책이 완전히 다름
예시 03 — 코호트 리텐션 분석
목적: 월별 가입 코호트의 리텐션 추이를 비교해 제품 개선 효과 확인
"2024년 1월~6월 가입 코호트별로 1주, 2주, 4주, 8주 리텐션을 계산해줘. 코호트가 개선되고 있는지 트렌드를 분석하고, 가장 리텐션이 높은 달과 낮은 달의 차이점을 가설로 제시해줘."
💡 코호트 비교는 제품/마케팅 변화의 효과를 측정하는 가장 강력한 방법
예시 04 — LTV 세그먼트 분석
목적: 고가치 유저의 특징을 파악해 더 많이 획득하고 유지하는 전략 수립
"유저를 LTV 기준으로 상위 20% / 중위 60% / 하위 20%로 나눠줘. 각 그룹의 특징(가입 채널, 첫 구매까지 시간, 디바이스, 할인 사용 여부)을 비교하고, 상위 20% 유저를 더 많이 획득하기 위한 타겟팅 전략을 제안해줘."
💡 파악된 고가치 유저 특징을 Meta/Google Ads의 유사 타겟 생성에 즉시 활용 가능
예시 05 — CAC 채널별 추이 분석
목적: 채널별 CAC 변화를 추적해 예산 효율 극대화
"채널별 월별 CAC 추이를 6개월간 보여줘. 전월 대비 CAC가 20% 이상 증가한 채널을 빨간 플래그로 표시하고, 원인 가설(경쟁 증가, 소재 피로도, 시즌성)을 각각 제시해줘. 이번 달 예산 재배분 추천도 해줘."
💡 원인 가설을 3가지 카테고리로 나누어 요청하면 더 체계적인 분석 제공
예시 06 — A/B 테스트 유의성 검증
목적: A/B 테스트가 통계적으로 의미 있는지 빠르게 판단
"A안(컨트롤): 노출 5,200명, 전환 104명. B안(테스트): 노출 5,100명, 전환 127명. 이 결과가 통계적으로 유의미한지(95% 신뢰수준) 검증하고, B안을 채택해도 되는지 판단해줘. 샘플 사이즈가 충분한지도 알려줘."
💡 "샘플 사이즈가 충분한지"를 함께 물으면 섣부른 판단 방지
예시 07 — 이탈 위험 유저 조기 탐지
목적: 이탈하기 전에 고위험 유저를 찾아 선제적 리텐션 활동
"최근 30일 내 로그인을 안 한 유저 중, 과거에는 주 2회 이상 활성이었던 유저를 찾아줘. 공통 특징(마지막 액션, 가입 기간, LTV)을 분석하고, 어떤 리텐션 캠페인 메시지로 접근하면 효과적일지 제안해줘."
💡 이 쿼리를 주 1회 자동 실행되도록 스케줄링하면 이탈 조기 경보 시스템이 됨
예시 08 — 프로모션 효과 전/후 비교
목적: 진행한 프로모션이 실제로 효과가 있었는지 측정
"11월 11일 30% 할인 프로모션 효과를 분석해줘. 비교 기간: 프로모션 1주 전/기간/1주 후. 항목: 신규 구매자 수, 재구매율, 평균 주문금액, 할인 없이 구매 전환율. 실제 순이익이 증가했는지도 계산해줘."
💡 "1주 후" 데이터 반드시 포함 — 수요 당김(Pull-forward) 효과 확인 필수
예시 09 — 디바이스별 전환율 차이 분석
목적: 모바일 vs 데스크탑 UX 개선 우선순위 결정
"디바이스(모바일/데스크탑/태블릿)별로 가입 전환율, 첫 구매 전환율, 평균 세션 시간을 비교해줘. 모바일에서 특별히 낮은 단계가 있다면 UX 문제 가설을 세워줘. 개선 임팩트가 가장 큰 곳 1곳을 추천해줘."
💡 모바일 전환율 저하는 대부분 결제 단계에서 발생
예시 10 — 재구매 유도 타이밍 최적화
목적: 첫 구매 후 언제 리마케팅 메시지를 보내야 재구매율이 가장 높은지 파악
"첫 구매 후 재구매까지 평균 며칠이 걸리는지 분석해줘. 구매 카테고리별로 분류하고, 재구매 전환율이 가장 높은 D+N일을 찾아줘. 이를 기반으로 이메일/푸시 알림 최적 타이밍 전략을 제안해줘."
💡 이 결과로 자동화 리마케팅 시퀀스의 발송 타이밍을 데이터 기반으로 설정 가능
예시 11 — RFM 분석으로 고객 등급 분류
목적: R(최근 구매일)/F(구매 횟수)/M(총 구매금액)으로 고객 세그멘테이션
"전체 고객을 RFM 기준으로 분류해줘. 각 지표를 5점 척도로 스코어링하고, VIP/잠재VIP/이탈위험/휴면/신규 5개 등급으로 나눠줘. 각 등급별 적합한 마케팅 전략을 1~2문장으로 설명해줘."
💡 RFM은 마케팅 자동화의 핵심 세그먼테이션 기법 — 매주 자동 업데이트 대시보드로 발전 가능
예시 12 — 광고 소재 피로도 분석
목적: 효과가 떨어지는 소재를 빠르게 탐지
"현재 집행 중인 광고 소재별로 주차별 CTR과 CVR 트렌드를 보여줘. CTR이 지속적으로 하락하는 소재를 찾고, 피로도가 가장 높은 소재 Top 3를 선정해줘. 교체 우선순위와 새 소재 방향성 제안도 부탁해."
💡 소재 피로도는 보통 4-8주 사이클로 체크. 빨리 교체할수록 동일 예산으로 더 많은 전환 가능
예시 13 — 지역별 성과 분포 분석
목적: "CAC 낮고 리텐션 높은" 황금 지역 발굴
"시/도별 신규 유저 수, CAC, 30일 리텐션을 비교해줘. 전국 평균 대비 CAC가 낮으면서 리텐션이 높은 황금 지역을 찾고, 이 지역에 예산을 집중했을 때 예상 효과를 계산해줘."
💡 황금 지역에서 효과적인 매체/메시지의 공통점을 파악하면 전국 적용 전략 수립 가능
예시 14 — 가입 경로별 첫 30일 행동 패턴 비교
목적: 어떤 채널로 들어온 유저가 가장 활성화되는지 파악
"채널(utm_source)별로 가입 후 30일 내 행동 패턴을 비교해줘. 비교 항목: 평균 로그인 횟수, 핵심 기능 사용률, 첫 구매 전환율, 30일 리텐션. 단순 가입자가 아닌 진짜 활성 유저를 데려오는 채널 순위를 매겨줘."
💡 "활성화 품질"로 채널을 평가하는 것이 장기적으로 더 정확한 채널 전략을 만들어 줌
예시 15 — 구독 플랜 업그레이드 트리거 분석
목적: 어떤 행동이 무료→유료 전환으로 이어지는지 파악
"무료 플랜에서 유료 플랜으로 업그레이드한 유저들의 직전 30일 행동을 분석해줘. 업그레이드 유저 vs 계속 무료 유저 간 행동 차이를 찾고, 업그레이드의 강력한 예측 신호가 되는 기능을 알려줘. 업그레이드 넛지(Nudge) 전략을 제안해줘."
💡 "업그레이드 예측 신호" 기능을 온보딩 시퀀스에서 의도적으로 유도하는 PLG 전략 수립 가능
예시 16 — 이메일 마케팅 성과 최적화
목적: 오픈율/클릭률/전환율 최적화
"지난 6개월 이메일 캠페인 데이터를 분석해줘. 오픈율이 가장 높았던 제목 유형(질문형/숫자형/혜택형), 클릭률 높은 CTA 문구 패턴, 전환율과 발송 요일·시간의 상관관계를 분석해줘. 다음 캠페인의 최적 발송 시간, 제목 가이드, CTA 추천을 정리해줘."
💡 "오픈 → 클릭 → 전환"을 분리해서 보는 것이 핵심. 오픈율만 보면 실제 매출 기여를 놓칠 수 있음
예시 17 — 바이럴 루프 분석 (추천인 효과)
목적: 추천을 통해 들어온 유저가 얼마나 더 가치 있는지 분석
"추천(referral) 가입 유저 vs 다른 채널 가입 유저를 비교해줘. 비교 항목: CAC(추천 비용 포함), 첫 구매 전환율, 90일 LTV, 본인도 추천하는 비율(K-factor). 추천 프로그램의 ROI를 계산하고, 현재 K-factor도 알려줘."
💡 K-factor가 1을 넘으면 마케팅 비용 없이 유기적으로 성장하는 상태
예시 18 — 계절성 패턴 분석 및 예측
목적: 시즌별 수요 패턴을 파악해 선제적 마케팅 예산 계획 수립
"지난 2년간 월별/주별 주문량, 신규 가입자 수, CAC 트렌드를 분석해줘. 계절성 패턴(성수기/비수기)을 찾고, 올해 남은 기간의 예측치를 제공해줘. 성수기 전 마케팅 캘린더도 제안해줘."
💡 최소 2년 데이터가 있어야 계절성과 성장 트렌드를 분리할 수 있음
예시 19 — 결제 이탈 분석 (Cart Abandonment)
목적: 장바구니/결제 단계에서 이탈하는 원인 파악
"결제 페이지 진입 후 이탈한 유저들의 패턴을 분석해줘. 이탈 유저 vs 완료 유저 차이점(이탈 시점, 디바이스, 주문금액, 쿠폰 사용 여부, 방문 횟수)을 비교하고, 이탈률이 가장 높은 주문금액 구간을 찾아줘. 리타겟팅 메시지와 장바구니 복구 전략 2가지를 제안해줘."
💡 "이탈 시점"(1페이지 vs 2페이지 vs 최종 클릭)을 파악하는 것이 중요 — 각 단계마다 원인이 다름
예시 20 — RFM 기반 이메일 자동화 시나리오 설계
목적: RFM 등급별 맞춤 자동화 이메일 시퀀스 설계
"RFM 분류된 고객 등급별로 자동화 이메일 시나리오를 설계해줘. VIP→리뷰 요청+신제품 선공개, 이탈위험→재활성화 쿠폰, 휴면→윈백 캠페인. 각 시나리오의 발송 트리거, 메시지 톤, 기대 전환율도 함께 제안해줘."
💡 RFM + 이메일 자동화를 연결하면 세그먼트별 최적 메시지가 자동 발송됨
'부트캠프' 카테고리의 다른 글
| 멋쟁이사자처럼 부트캠프 그로스마케팅 4기 27일차_260416 (0) | 2026.04.16 |
|---|---|
| 멋쟁이사자처럼 부트캠프 그로스마케팅 4기 26일차_260415 (1) | 2026.04.15 |
| 멋쟁이사자처럼 부트캠프 그로스마케팅 4기 24일차_260413 (0) | 2026.04.13 |
| 멋쟁이사자처럼 부트캠프 그로스마케팅 4기 23일차_260410 (0) | 2026.04.10 |
| 멋쟁이사자처럼 부트캠프 그로스마케팅 4기 22일차_260409 (0) | 2026.04.09 |