korean-scraper
Korean website specialized scraper with anti-bot protection (Naver, Coupang, Daum, Instagram)
Install via CLI (Recommended)
clawhub install openclaw/skills/skills/mupengi-bot/korean-scraperkorean-scraper
한국 웹사이트 전문 스크래퍼 — Playwright 기반으로 네이버, 쿠팡, 다음 등 한국 주요 사이트에서 구조화된 데이터를 추출합니다. Anti-bot 보호 우회 기능 포함.
When to Use
- 네이버 블로그 검색 결과 수집 또는 특정 블로그 본문 추출
- 네이버 카페 인기글/최신글 스크래핑
- 쿠팡 상품 정보 (가격, 리뷰, 별점) 수집
- 네이버 뉴스/다음 뉴스 기사 본문 추출
- 한국 사이트 대상 자동화된 데이터 수집
Installation
cd skills/korean-scraper
npm install
npx playwright install chromium
Quick Start
네이버 블로그
# 검색 결과 수집
node scripts/naver-blog.js search "맛집 추천" --limit 10
# 특정 블로그 본문 추출
node scripts/naver-blog.js extract "https://blog.naver.com/..."
네이버 카페
# 인기글 수집
node scripts/naver-cafe.js popular "카페URL" --limit 20
# 최신글 수집
node scripts/naver-cafe.js recent "카페URL" --limit 20
쿠팡 상품
# 상품 정보 추출
node scripts/coupang.js product "상품URL"
# 검색 결과 수집
node scripts/coupang.js search "무선 이어폰" --limit 20
네이버 뉴스
# 검색 결과 수집
node scripts/naver-news.js search "AI" --limit 10
# 기사 본문 추출
node scripts/naver-news.js extract "https://n.news.naver.com/..."
다음 뉴스
# 검색 결과 수집
node scripts/daum-news.js search "경제" --limit 10
# 기사 본문 추출
node scripts/daum-news.js extract "https://v.daum.net/..."
Output Format
모든 스크립트는 구조화된 JSON을 반환합니다:
네이버 블로그 검색
{
"status": "success",
"query": "맛집 추천",
"count": 10,
"results": [
{
"title": "서울 강남 맛집 추천 BEST 5",
"url": "https://blog.naver.com/...",
"blogger": "맛집탐험가",
"date": "2026-02-15",
"snippet": "강남역 근처 숨은 맛집들을..."
}
]
}
네이버 블로그 본문
{
"status": "success",
"url": "https://blog.naver.com/...",
"title": "서울 강남 맛집 추천 BEST 5",
"author": "맛집탐험가",
"date": "2026-02-15",
"content": "# 서울 강남 맛집 추천 BEST 5\n\n1. ...",
"images": ["https://..."],
"tags": ["맛집", "강남", "서울"]
}
쿠팡 상품
{
"status": "success",
"url": "https://www.coupang.com/...",
"productName": "애플 에어팟 프로 2세대",
"price": 299000,
"originalPrice": 359000,
"discount": "17%",
"rating": 4.8,
"reviewCount": 1523,
"rocketDelivery": true,
"seller": "쿠팡",
"images": ["https://..."]
}
네이버 카페
{
"status": "success",
"cafeUrl": "https://cafe.naver.com/...",
"type": "popular",
"count": 20,
"posts": [
{
"title": "신입 회원 인사드립니다",
"url": "https://cafe.naver.com/.../12345",
"author": "닉네임",
"date": "2026-02-17",
"views": 523,
"comments": 12
}
]
}
뉴스 기사
{
"status": "success",
"url": "https://n.news.naver.com/...",
"title": "AI 시장 규모 급성장 전망",
"media": "조선일보",
"author": "홍길동 기자",
"date": "2026-02-17 09:30",
"content": "# AI 시장 규모 급성장 전망\n\n...",
"category": "IT/과학",
"images": ["https://..."]
}
Anti-Bot Features
- navigator.webdriver 숨김 — 자동화 탐지 회피
- 실제 User-Agent 사용 — 모바일/데스크탑 랜덤
- 인간 행동 모방 — 랜덤 딜레이, 스크롤
- Stealth Plugin — Playwright extra stealth
- Cloudflare 우회 — 대기 시간 자동 조정
Rate Limiting
모든 스크립트는 기본적으로 사이트를 보호합니다:
Metadata
Not sure this is the right skill?
Describe what you want to build — we'll match you to the best skill from 16,000+ options.
Find the right skillPaste this into your clawhub.json to enable this plugin.
{
"plugins": {
"official-mupengi-bot-korean-scraper": {
"enabled": true,
"auto_update": true
}
}
}Related Skills
prompt-engineer
Expert prompt engineer specializing in advanced prompting techniques, LLM optimization, and AI system design. Masters chain-of-thought, constitutional AI, and production prompt strategies. Use when building AI features, improving agent performance, or crafting system prompts.
appointment-scheduler
Automated appointment management for beauty salons, clinics, studios, and photo booths. Handles booking requests, calendar sync, conflict detection, reminders, no-show tracking, and waitlist management.
Mupeng Social Postcjo
Skill by mupengi-bot
data-scraper
Web page data collection and structured text extraction
auto-reply
Instagram DM auto-reply system. DM monitoring, reading, replying, security check (injection rejection). Use when checking Instagram DMs, reading unread messages, replying to DMs, setting up DM monitoring cron jobs, or handling DM auto-reply workflows. Triggers on: Instagram DM, DM check, DM reply, DM auto-reply, dm-alert.