부트캠프

멋쟁이사자처럼 부트캠프 그로스마케팅 4기 26일차_260415

Yuuma 2026. 4. 15. 17:03
Day9·10 | 프롬프트 엔지니어링 + 크롤링 기초
GROWTH MARKETING BOOTCAMP

Day9·10 | 프롬프트 엔지니어링 &
정적 크롤링 기초

2026.04.14–15  |  데이터분석개론 + 데이터 수집 및 전처리
프롬프트 엔지니어링 MCP 실습 ShopFlow 분석 크롤링 requests + BeautifulSoup
1
그로스 마케터를 위한 프롬프트 엔지니어링
💡
왜 프롬프트 엔지니어링인가

그로스 마케터에게 프롬프트 엔지니어링은 "데이터 분석 코딩 능력"을 대체하는 핵심 스킬이다. SQL을 직접 짜지 못해도, Claude에게 올바른 질문을 던지면 최고 수준의 데이터 분석이 가능하다. 같은 데이터를 보면서도 어떻게 질문하느냐에 따라 결과물의 품질이 10배 이상 달라진다.

1-1. 프롬프트의 4가지 핵심 구성요소

프롬프트 4가지 핵심 구성요소
프롬프트의 4가지 핵심 구성요소 — Role / Context / Task / Format
요소설명예시
역할 Role Claude에게 어떤 전문가 역할을 맡길지 설정 "너는 10년 경력의 그로스 마케터야"
맥락 Context 비즈니스 상황, 데이터 구조, 현재 문제 설명 "우리 서비스는 B2C SaaS, MAU 5만, 현재 리텐션이 핵심 문제"
작업 Task 정확히 무엇을 해달라는 것인지 명시 "월별 코호트 리텐션을 계산하고 이탈 패턴을 분석해줘"
형식 Format 결과물의 형태, 길이, 구조 지정 "표 형식으로 정리하고, 핵심 인사이트 3줄로 요약해줘"
📌
실전 팁: 4요소를 한 번에 담아라

"[Role] 너는 그로스 마케터야. [Context] 우리는 B2C SaaS, MAU 5만이야. [Task] 지난달 채널별 CAC를 비교해줘. [Format] 표로 정리하고 인사이트 3줄로 요약해줘." — 4요소가 모두 있으면 Claude의 답변 품질이 확연히 올라간다.


1-2. 프롬프트 패턴 5가지

단순히 잘 묻는 것을 넘어, 어떤 패턴으로 대화를 구성하느냐가 분석의 깊이를 결정한다.

프롬프트 패턴 5가지
그로스 마케터를 위한 프롬프트 패턴 5가지

패턴 1 — 드릴다운 (Drill-down)

큰 그림에서 시작해 점점 구체적인 원인을 파고드는 패턴. 실제 분석은 항상 "왜?"라는 질문의 연속이다.

드릴다운 패턴 예시 1단계 (전체 현황)"지난달 채널별 신규 유저 획득 수와 CAC를 보여줘" 2단계 (문제 발견)"페이스북 CAC가 가장 높네. 캠페인별로 쪼개줘" 3단계 (원인 파악)"campaign_id 203의 CPA가 왜 높은지 소재/타겟별로 분석해줘" 4단계 (액션 도출)"이 분석을 바탕으로 예산 재배분 방안을 3가지 제안해줘"

패턴 2 — 가설 검증

마케터가 이미 가설을 가지고 있을 때 이를 데이터로 검증하는 패턴.

가설 검증 패턴 예시 "내 가설은 [주말에 가입한 유저가 평일 가입 유저보다 30일 리텐션이 낮다]야. 1) 가입 요일별 30일 리텐션 비교 2) 통계적으로 유의미한지 판단 3) 맞다면 원인 가설 3가지, 틀리다면 어떤 변수가 실제로 영향을 주는지 찾아줘"

패턴 3 — 비교 분석

두 개 이상의 그룹/기간/채널을 체계적으로 비교할 때 사용. 마지막에 판단을 요청하는 것이 핵심.

비교 분석 패턴 예시 "다음 두 그룹을 비교해줘: - 그룹 A: 쿠폰 사용해서 첫 구매한 유저 - 그룹 B: 정가로 첫 구매한 유저 비교 항목: LTV 90일, 재구매율, 평균 주문금액, 리텐션 곡선 마지막에 어떤 그룹이 비즈니스에 더 가치 있는지 판단해줘"

패턴 4 — 이상 탐지

KPI가 갑자기 변했을 때 원인을 빠르게 찾는 패턴. 원인 후보를 구조화해서 순서대로 좁혀간다.

이상 탐지 패턴 예시 "어제 DAU가 전주 동요일 대비 23% 하락했어. 1) 신규/기존 유저 중 어디서 하락했는지 2) 특정 채널, 디바이스, 지역에서 집중됐는지 3) 특정 기능/페이지 사용이 줄었는지 가장 가능성 높은 원인을 우선순위로 정렬해줘"

패턴 5 — 예측 & 시뮬레이션

현재 트렌드를 기반으로 미래를 예측하거나 전략의 효과를 시뮬레이션할 때 사용. "만약 ~라면" 시나리오 구성이 핵심.

예측·시뮬레이션 패턴 예시 "현재 데이터를 기반으로: 1) 이번 달 말 MRR 예측 (현재 성장률 유지 시) 2) 만약 리텐션을 5%p 개선하면 6개월 후 MRR 변화 3) CAC를 20% 줄이면 같은 예산으로 몇 명을 더 획득할 수 있는지 각 시나리오를 표로 정리해줘"

1-3. 실전 프롬프트 예시 — 핵심 8개 정리

20개 예시 중 반복 활용 가능성이 높은 핵심 8개를 선별했다.

예시 01 채널별 신규 유저 획득 현황
"지난 3개월간 채널(utm_source)별 신규 가입자 수, 전체 대비 비율, 월별 트렌드를 보여줘. 가장 성장하는 채널과 감소하는 채널을 각각 1개씩 찾아줘."
💡 실무 팁: 월별 트렌드를 함께 요청하면 계절성/캠페인 효과를 동시에 파악 가능. "전체 대비 비율"을 넣으면 Mix 변화를 놓치지 않는다.
예시 03 코호트 리텐션 분석
"2024년 1월~6월 가입 코호트별로 1주, 2주, 4주, 8주 리텐션을 계산해줘. 코호트가 개선되고 있는지 트렌드를 분석하고, 가장 리텐션이 높은 달과 낮은 달의 차이점을 가설로 제시해줘."
💡 실무 팁: 코호트 비교는 제품/마케팅 변화의 효과를 측정하는 가장 강력한 방법. "가설로 제시해줘"를 추가하면 단순 수치를 넘어 인사이트를 얻는다.
예시 06 A/B 테스트 결과 유의성 검증
"A안(컨트롤): 노출 5,200명, 전환 104명. B안(테스트): 노출 5,100명, 전환 127명. 이 결과가 통계적으로 유의미한지(95% 신뢰수준) 검증하고, B안을 채택해도 되는지 판단해줘. 샘플 사이즈가 충분한지도 알려줘."
💡 실무 팁: 통계 지식 없이도 A/B 테스트 결론을 낼 수 있다. "샘플 사이즈가 충분한지"를 함께 물으면 섣부른 판단을 방지할 수 있다.
예시 11 RFM 분석으로 고객 등급 분류
"전체 고객을 RFM(Recency: 최근 구매일, Frequency: 구매 횟수, Monetary: 총 구매금액) 기준으로 분류해줘. 각 지표를 5점 척도로 스코어링하고, VIP/잠재VIP/이탈위험/휴면/신규 5개 등급으로 나눠줘. 각 등급별 적합한 마케팅 전략을 1~2문장으로 설명해줘."
💡 실무 팁: RFM은 마케팅 자동화의 핵심 세그먼테이션 기법. 한 번 분류 기준을 만들면 매주 자동 업데이트되는 대시보드로 발전 가능하다.
예시 15 구독 플랜 업그레이드 트리거 분석
"무료 플랜에서 유료 플랜으로 업그레이드한 유저들의 업그레이드 직전 30일 행동을 분석해줘. 업그레이드 유저 vs 계속 무료 유저 간의 행동 차이를 찾고, 어떤 기능 사용이 업그레이드의 강력한 예측 신호인지 알려줘. 이를 바탕으로 업그레이드 넛지(Nudge) 전략을 제안해줘."
💡 실무 팁: "업그레이드 예측 신호" 기능들을 파악하면 온보딩 시퀀스에서 해당 기능 경험을 의도적으로 유도하는 Product-Led Growth(PLG) 전략 수립 가능.
예시 17 바이럴 루프 분석 (추천인 효과)
"추천(referral)을 통해 가입한 유저 vs 다른 채널로 가입한 유저를 비교해줘. 비교 항목: CAC(추천 비용 포함), 첫 구매 전환율, 90일 LTV, 본인도 추천을 하는 비율(K-factor). 추천 프로그램의 ROI를 계산하고, 현재 바이럴 계수(K-factor)가 얼마인지도 알려줘."
💡 실무 팁: K-factor가 1을 넘으면 마케팅 비용 없이 유기적으로 성장하는 상태. 이 분석으로 추천 프로그램 인센티브 조정의 근거를 만들 수 있다.
2
[실습] ShopFlow MCP 데이터 분석

수업에서 배운 MCP + Claude 환경을 직접 활용해 가상 이커머스 서비스 ShopFlow의 2024년 상반기 데이터를 분석했다. 아래 3가지 관점에서 인사이트를 얻는 것이 목표였다.

2,032만원
6월 매출 (MoM +71%)
54.8%
모바일 결제 CVR
55.7%
전체 재구매율
4,476원
Email CPA (채널 최저)

핵심 인사이트 3가지

INSIGHT 01
플랜 업그레이드가
리텐션의 단일 최강 레버
82.4%p

프리미엄 재구매율 86.7% vs 프리 플랜 4.3%. 첫 구매 후 30일 이내가 골든타임.

INSIGHT 02
Kakao 삼중 부진 —
즉각 예산 차단 필요
재구매 0%

결제 CVR 20% + 재구매율 0% + 활성화율 65% 전 채널 동시 꼴찌. 월 399만원 낭비.

INSIGHT 03
모바일 CVR 7월 급락 —
checkout UX 긴급 대응
-75%p

1월 100% → 7월 20%대 급락. checkout_start → complete 구간 47.6% 이탈이 병목.

📊
채널 효율 비교 핵심 발견

Email CPA 4,476원 vs Facebook CPA 88,007원 — 무려 20배 차이. 그런데 Email 예산 비중은 고작 2.4%. 가장 비효율적인 채널(Facebook)에 예산의 29%가 집중되어 있었다. 이 불균형 해소만으로도 ROI가 즉시 개선 가능하다는 것이 이번 실습의 가장 큰 발견이었다.

🔧
실습에서 활용한 데이터셋: ShopFlow

DBeaver에서 MySQL로 연결된 가상 이커머스 데이터셋. sf_users(200건) / sf_orders(500건) / sf_events(2,000건) / sf_campaigns(100건) / sf_referrals(150건) 5개 테이블로 구성. Claude Desktop + MCP 서버를 통해 자연어로 직접 SQL 쿼리를 생성·실행했다.

3
Day10 — 정적 크롤링 기초

3-1. 크롤링이란?

크롤링(Crawling)은 프로그램이 자동으로 웹사이트에 접속해서 필요한 정보만 추출해오는 기술이다. 우리가 브라우저로 뉴스를 보는 것처럼, 코드가 대신 수백 개의 페이지를 돌아다니며 데이터를 모아준다.

🤔
쉽게 말하면?

매일 아침 뉴스를 정리하던 일을, 코드가 1초 만에 100개씩 해주는 것. 경쟁사 가격 모니터링, 브랜드 뉴스 수집, 소비자 리뷰 분석 등 그로스 마케터가 반복적으로 하는 수집 작업을 자동화한다.

방식설명도구난이도
정적 크롤링HTML을 그대로 읽어옴requests + BeautifulSoup쉬움
RSS/API공식 데이터 피드 활용requests + XML 파싱쉬움
동적 크롤링JavaScript 페이지 처리Selenium, Playwright어려움

3-2. 크롤링의 법적 문제 ⚠️ 반드시 확인

⚠️
크롤링은 잘못하면 법적 문제가 생긴다

특히 상업적 목적으로 사용할 때는 아래 3가지를 꼭 확인해야 한다. 무심코 시작했다가 데이터 보호법 위반이나 약관 위반이 될 수 있다.

① robots.txt 확인
모든 웹사이트에는 크롤러 접근 규칙이 담긴 robots.txt가 있다. https://사이트주소/robots.txt로 접속해서 확인. Disallow: / 가 있으면 크롤링 금지.

② 서비스 이용약관(TOS) 확인
Google, Amazon, LinkedIn 등 대형 플랫폼은 자동화된 수집을 약관으로 금지하고 있다.

③ 개인정보 포함 여부
이름, 전화번호, 이메일 등 개인정보 수집 시 개인정보 보호법 위반. 소셜미디어 크롤링 시 특히 주의.

✅ 안전한 크롤링

  • 공식 RSS/API 활용
  • robots.txt 허용 경로
  • 공개된 공공데이터 수집
  • 학습·연구 목적
  • 요청 간격 두기 (느리게)

❌ 위험한 크롤링

  • 로그인이 필요한 페이지
  • robots.txt 금지 경로
  • 개인정보 수집·저장
  • 수집 데이터 무단 재배포
  • 짧은 시간 수천 번 요청

3-3. 크롤링 필수 라이브러리 3개

라이브러리역할비유
requests웹사이트에 데이터 요청도서관에 책 빌리러 가는 사람
BeautifulSoupHTML/XML에서 원하는 내용 추출책에서 필요한 페이지만 찾아주는 사람
csv데이터를 파일로 저장찾은 내용을 노트에 정리해주는 사람
설치 코드 (코랩에서 맨 처음 1회만) # -q 옵션은 설치 메시지를 줄여줌 (Quiet) !pip install requests beautifulsoup4 lxml -q

3-4. 크롤링 기본 흐름 4단계

크롤링 4단계 흐름
정적 크롤링 기본 흐름 — 라이브러리 불러오기 → 요청 → 파싱 → 추출 → 저장
크롤링 기본 코드 구조 # 1단계: 도구 불러오기 import requests from bs4 import BeautifulSoup from urllib.parse import quote_plus # 한글을 URL에 넣을 수 있게 해주는 함수 # 2단계: 가져올 주소 지정 (검색어만 바꾸면 됨) search_query = "마케팅" rss_url = f"https://news.google.com/rss/search?q={quote_plus(search_query)}&hl=ko&gl=KR&ceid=KR:ko" # 3단계: 데이터 요청 (브라우저처럼 접속) response = requests.get(rss_url, headers={"User-Agent": "Mozilla/5.0"}) # 4단계: 파싱 - 읽기 좋게 분해 soup = BeautifulSoup(response.text, "xml") # 5단계: 원하는 태그 내용 꺼내기 items = soup.find_all("item") for item in items[:10]: title = item.find("title").text print(title)
명령어설명예시
requests.get(url)해당 주소의 데이터를 가져옴뉴스 RSS 주소 접속
response.text받아온 내용 (문자열 전체)HTML/XML 전체 내용
BeautifulSoup(data, "xml")XML 파싱RSS 피드 읽기
soup.find("태그")해당 태그 처음 1개 찾기title 태그 1개
soup.find_all("태그")해당 태그 모두 찾기item 태그 100개
.text태그 안의 텍스트만 꺼내기"오늘의 뉴스 제목"
encoding="utf-8-sig"엑셀에서 한글이 깨지지 않게 하는 인코딩CSV 저장 시 필수
🔑
RSS 있으면 바로 파싱 가능 — RSS 없으면 어려워진다

구글 뉴스, 네이버 뉴스, 유튜브 채널, 티스토리/워드프레스는 RSS 있음 → 오늘 배운 방법으로 바로 수집 가능.
쿠팡/네이버쇼핑, 인스타그램/트위터는 RSS 없음 → Selenium(동적 크롤링) 또는 공식 API 키 발급 필요.

📝 오늘의 핵심 요약

  • 프롬프트 4요소(Role/Context/Task/Format)를 모두 담으면 Claude 답변 품질이 크게 올라간다.
  • 분석 목적에 맞는 패턴(드릴다운/가설검증/비교/이상탐지/예측)을 골라 쓰는 것이 핵심.
  • ShopFlow 실습: Email CPA(4,476원) vs Facebook CPA(88,007원) — 채널 예산 불균형이 가장 큰 문제였다.
  • 크롤링 전 robots.txt + TOS + 개인정보 3가지는 반드시 먼저 확인. Google News RSS는 공식 서비스라 안전.
  • 크롤링 = requests(요청) + BeautifulSoup(파싱) + csv(저장) 3개 라이브러리만 알면 기본 정적 크롤링 가능.