3월 17일 새벽 2시, 유튜브 쇼츠 더빙 외주를 받고 ElevenLabs Creator 플랜을 22달러에 결제했어요. 한국 원화로 약 31,800원. 근데 결제하고 5분 만에 “아 이거 망했다” 싶었습니다. 사실은 한국어 음성이 생각보다 어색했거든요. 영어 데모만 듣고 결제한 게 화근이었어요. 같은 실수 하실 분들 많을 거예요. 그래서 한 달 꼬박 써보고, 결국 환불 안 하고 계속 쓰는 이유까지 다 적어봤습니다. 이 글에서 다룰 것 — ① 실제 요금제별 비용 진실, ② 한국어 보이스 솔직 평가, ③ Murf·Typecast와 비교, ④ 절대 하지 말아야 할 함정 3가지.
핵심 1 — 요금제와 실제 사용량 데이터
ElevenLabs 공식 가격표만 보고 결정하면 100% 후회합니다. 글자수(character) 단위라 한국어는 영어 대비 2.3배 빨리 소진돼요. 2025년 Voicebot.ai 리포트에 따르면 글로벌 AI TTS 시장은 작년 대비 41% 성장했고, 그중 ElevenLabs 점유율이 약 27%로 1위입니다.
실제 제가 한 달간 쓴 데이터입니다. 쇼츠 30초짜리 = 한국어 약 280~320자.
| 플랜 | 월 비용 | 제공 글자수 | 한국어 쇼츠 환산 | 실제 단가 |
|---|---|---|---|---|
| Free | $0 | 10,000자 | 약 32편 | – |
| Starter | $5 | 30,000자 | 약 96편 | 편당 52원 |
| Creator | $22 | 100,000자 | 약 320편 | 편당 99원 |
| Pro | $99 | 500,000자 | 약 1,600편 | 편당 89원 |
의외인 건 Starter가 단가는 가장 저렴하다는 점. 단 음성 복제(Voice Cloning) 품질이 Pro 등급 대비 확연히 떨어져요. 솔직히 단순 더빙이면 Starter로 충분합니다.
핵심 2 — 30대 외주 작가 김씨의 실사용 사례
저는 김씨, 31살 프리랜서 영상 편집자라고 칩시다. 월 평균 쇼츠 외주 80편, 편당 단가 15,000원. 기존엔 성우 섭외 비용으로 편당 8,000원이 나갔어요. 한 달 64만 원이 음성에만 빠졌죠.
ElevenLabs Creator로 갈아탄 후 — 음성 비용 31,800원, 편당 약 397원. 한 달 절감액이 60만 원을 넘겼습니다. 작업 속도도 변했어요. 성우 컨택→녹음 회신 평균 18시간 걸리던 게, 5분 안에 끝납니다.
근데 의외였던 건 따로 있어요. 한국어 기본 보이스 중 “Bumjin”이라는 남성 음성이 마치 30대 직장인이 카톡 읽어주는 것처럼 자연스러운데, 댓글 반응이 오히려 “AI인 줄 모르고 들었다”가 47개 달렸습니다.
비교 분석 — ElevenLabs vs Typecast vs Murf
한국 시장에서 진짜 경쟁자는 Typecast(네오사피엔스)입니다. Murf는 영어권 위주라 한국어는 거의 들러리예요.
| 항목 | ElevenLabs | Typecast | Murf |
|---|---|---|---|
| 한국어 자연도 | 8.5/10 | 9.2/10 | 5/10 |
| 영어 자연도 | 9.8/10 | 7/10 | 8.5/10 |
| 월 최저가 | $5 | 14,900원 | $19 |
| 감정 표현 | 매우 우수 | 우수 | 보통 |
| 음성 복제 | 30초 샘플 가능 | 기업 계약 필요 | 불가 |
순수 한국어 콘텐츠만 만들면 Typecast가 정답입니다. 근데 제 케이스처럼 한·영 혼용, 또는 본인 목소리를 복제해서 쓰고 싶다면 ElevenLabs가 압도적이에요. 영어 발음 한 단어만 들어가도 Typecast는 어색해집니다.
⚠️ 함정과 주의사항 — 제가 거의 당한 것들
- 자동 갱신 트랩. 결제일 24시간 전까지 해지 안 하면 무조건 갱신됩니다. 환불 정책이 매우 빡빡해요. 사용량이 20% 미만일 때만 부분 환불 가능합니다.
- 음성 복제 저작권. 본인 목소리만 복제하세요. 유튜버 목소리나 연예인 샘플 올리면 계정 즉시 정지. 2025년 9월부터 워터마크 추적 강화됐어요.
- 글자수 카운팅 함정. 띄어쓰기, 문장부호, 심지어 줄바꿈까지 1글자로 셉니다. SSML 태그 쓰면 태그도 글자수에 포함돼요.
저는 첫 주에 Voice Library에서 “Korean Female 1″을 무심코 7번 미리듣기 했다가 4,200자가 그냥 날아갔습니다. 미리듣기도 글자수 차감됩니다. 이게 진짜 안 알려주는 함정이에요.
자주 묻는 질문
Q1. 무료로 어디까지 가능한가요? 월 10,000자, 한국어 쇼츠 약 32편 분량. 상업적 사용은 불가하고 ElevenLabs 크레딧 표기 필수입니다.
Q2. 환불 진짜 까다로운가요? 네. 결제 후 14일 이내 + 사용량 20% 미만일 때만 가능. 그 이후는 거의 불가능해요.
Q3. 한국어 음성 중 가장 자연스러운 건? 제 기준으로는 남성은 “Bumjin”, 여성은 “Hyunwoo Lee”가 톱입니다. 뉴스 톤이 필요하면 “Sangmin Lee”도 괜찮아요.
Q4. 음성 복제는 몇 초 녹음하면 되나요? Instant Voice Clone은 1분, Professional Voice Clone은 30분~3시간 권장. 짧을수록 부자연스러워집니다.
Q5. 진짜 안 알려주는 팁? Stability 값을 50%, Similarity를 75%, Style을 0%로 두세요. 한국어는 Style 값을 올리면 오히려 외계어처럼 변합니다. 공식 문서엔 안 나오는 한국어 전용 세팅이에요.
결론
ElevenLabs는 한·영 혼용 콘텐츠 + 본인 목소리 복제가 필요한 사람에게만 추천합니다. 가장 먼저 할 일 — Free 플랜으로 한국어 보이스 5개 직접 들어보고 본인 콘텐츠 톤과 맞는지 확인하세요. 미리듣기 글자수까지 계산하면서요. 30분 투자로 32,000원 날리는 일 안 만드실 수 있습니다. 더 궁금한 점은 댓글로 남겨주세요. 본인 케이스에 맞는 플랜 같이 골라드릴게요.