유튜브 자막 추출·다운로드 — 3가지 방법 (2026)

YouTube 영상에서 자막(SRT·VTT·TXT)을 빠르게 받는 방법은 사실상 3가지입니다. 첫째, YouTube 자체 \"스크립트 표시\"로 무료 복사. 둘째, DownSub·SaveSubs 같은 무료 사이트에 URL 붙여넣기로 파일 다운로드. 셋째, 자막이 없거나 자동 자막이 부정확한 영상이라면 VexaScribe로 AI 재전사. 본인 영상이 어떤 상황인지에 따라 정답이 달라집니다 — 아래에서 결정 기준을 정직하게 정리합니다.

30분 무료 (신용카드 불필요)SRT·VTT·TXT 내보내기한국어 정확도 88~93%

지원 형식

SRTVTTTXTMP3MP4M4A

짧게 답하면

유튜브 자막을 다운로드·추출하는 3가지 방법: (1) YouTube 자체 자막 다운로드 — 무료, 가장 빠름, 자막이 있는 영상에만 가능. (2) DownSub·SaveSubs 같은 무료 사이트 — URL 붙여넣기로 SRT/VTT 받기. (3) VexaScribe — 자막이 없거나 부정확한 경우 AI로 새로 생성, SRT/VTT 내보내기. 깨끗한 한국어 영상이면 (1)이 충분합니다. 자동 자막이 부정확하거나 자막이 아예 없는 영상이면 (3)이 필요합니다.

정직한 한 마디: 자막이 잘 달려 있는 한국어 영상의 텍스트만 빠르게 복사하면 되는 경우라면 YouTube 자체 기능이 가장 빠르고 충분합니다. AI 도구를 굳이 쓸 필요 없습니다. 반대로 자막이 없거나, 자동 자막이 60~75%밖에 안 맞거나, 화자 분리가 필요한 인터뷰·팟캐스트 영상이라면 VexaScribe가 정답입니다.

3가지 방법 한눈에 비교

어떤 방법이 본인 영상에 맞는지 빠르게 결정하기 위한 비교표입니다. 2026년 6월 기준 각 도구의 공개 정보를 정리했습니다.

방법비용출력 형식정확도 (한국어)자막 없는 영상
YouTube 자체 다운로드무료TXT (복사·붙여넣기)정식 자막 95%+ / 자동 60~75%불가
DownSub·SaveSubs무료 (광고 있음)SRT, VTT, TXTYouTube 원본과 동일불가
VexaScribe AI 재전사30분 무료, 이후 월 $2~$20SRT, VTT, TXT (+ 화자 라벨)88~93% (Whisper Large v3)✅ 가능 (음성만 있으면 OK)

한국어 정확도는 공개된 ASR 벤치마크 및 Open ASR Leaderboard 기준이며, 영상의 음질·억양·전문 용어에 따라 실제 수치는 달라질 수 있습니다.

방법 1 — YouTube 자체 자막 다운로드 (무료, 가장 빠름)

자막이 이미 잘 있는 한국어 영상이면 굳이 외부 도구를 쓸 필요가 없습니다. YouTube 자체 \"스크립트 표시\" 기능으로 텍스트만 복사하면 됩니다.

3단계 가이드

  1. 1단계 — 영상 페이지 열기. PC 브라우저로 YouTube 영상을 엽니다 (모바일 앱에서는 일부만 지원).
  2. 2단계 — \"...\" 메뉴 → \"스크립트 표시\" 클릭. 영상 설명 아래쪽 \"...\" 점 세 개 버튼을 누르고 \"스크립트 표시(Show transcript)\"를 선택하면 우측 패널에 시간코드와 함께 자막이 펼쳐집니다.
  3. 3단계 — 텍스트 드래그 → 복사. 전체 자막을 드래그해서 복사(Ctrl/Cmd+C)한 뒤 메모장·Notion·Google Docs 등에 붙여넣으면 끝입니다. 시간코드가 필요 없으면 패널 상단 메뉴에서 \"타임스탬프 토글\"로 끌 수 있습니다.

한계 — 이 방법으로 안 되는 경우

  • 영상 제작자가 자막을 안 올렸고 자동 자막도 꺼져 있으면 스크립트 자체가 없습니다.
  • 자동 자막만 있는 경우 정확도가 60~75% 수준이라 그대로 쓰기 어려운 영상이 많습니다.
  • SRT·VTT 같은 시간코드 파일이 필요하면 별도 도구가 필요합니다 (다음 방법 참고).

비용: 완전 무료. 추천 대상: 자막이 이미 깨끗하게 잘 달려 있는 한국어 영상의 텍스트만 빠르게 복사하면 충분한 경우.

방법 2 — DownSub·SaveSubs 등 무료 자막 다운로드 사이트

SRT·VTT 파일 형식으로 자막을 받고 싶다면 무료 자막 다운로드 사이트가 가장 간단합니다. 대표적인 서비스는 DownSub, SaveSubs, KeepSubs 등이며 사용 방법은 모두 비슷합니다.

사용법 (DownSub 기준)

  1. YouTube 영상 페이지에서 URL을 복사합니다.
  2. DownSub(또는 SaveSubs 등) 입력란에 URL을 붙여넣고 \"다운로드\" 버튼을 클릭합니다.
  3. 지원되는 자막 언어 목록이 표시되면 한국어를 골라 SRT 또는 VTT 형식으로 받습니다.

장점과 한계

  • 장점: 완전 무료, 가입 불필요, 시간코드 포함 SRT/VTT 즉시 다운로드.
  • 한계: 자막 품질은 YouTube가 제공하는 데이터와 동일합니다 — 자동 자막이면 정확도도 자동 자막 수준입니다.
  • 광고: 일부 사이트는 가짜 \"Download\" 버튼 광고를 노출합니다. 진짜 다운로드 링크만 클릭하세요.
  • ToS: 상업 용도라면 YouTube 서비스 약관과 영상 저작권을 별도로 확인하세요.

비용: 무료. 추천 대상: SRT/VTT 파일 자체가 필요하고, 영상에 이미 적절한 자막이 달려 있는 경우.

방법 3 — VexaScribe로 AI 재전사 (자막이 없거나 부정확할 때)

YouTube 영상에 자막이 아예 없거나, 자동 자막이 60~75%밖에 안 맞아서 그대로 쓰기 어려운 경우에는 음성을 새로 전사하는 것이 가장 빠른 해결책입니다. VexaScribe는 OpenAI Whisper 기반의 AI로 영상·음성 파일에서 한국어 자막을 직접 생성합니다.

VexaScribe의 강점

  • 한국어 정확도 약 88~93% (Whisper Large v3 기준) — YouTube 자동 자막보다 분명히 정확합니다.
  • 한국어 + 영어 혼합 IT·외국계 회사 영상에 강합니다 (코드 스위칭 처리).
  • 화자 분리(speaker diarization) + 타임스탬프 자동 적용 — 인터뷰·팟캐스트 영상에 유용합니다.
  • SRT·VTT·TXT 모두 한 번에 내보내기 가능.
  • 최대 5 GB 파일 직접 업로드 — 4K 장편 영상도 OK.
  • 웹 브라우저에서 바로 사용 — 설치·플러그인 불필요.

한계와 주의 사항

  • YouTube에서 영상을 직접 가져오는 기능은 없습니다 — 영상 또는 음성 파일을 본인이 먼저 다운로드해 업로드해야 합니다.
  • 영상 다운로드는 영상 저작권·YouTube 약관을 따라야 합니다 (개인 학습·연구 용도 위주 권장).
  • 30분 무료 이후는 월 $2~$20 (≈ 2,700~27,000원) 유료 플랜이 필요합니다.

비용: 30분 무료, 이후 월 $2~$20. 추천 대상: 자막 없는 영상, 자동 자막이 부정확한 한국어 영상, 한국어+영어 혼합 영상, 화자 분리가 필요한 인터뷰·팟캐스트.

YouTube 자동 자막은 왜 한국어에서 자주 틀릴까?

\"자동 자막만 켜져 있는데 그대로 써도 되나요?\"라는 질문을 많이 받습니다. 답은 영상의 종류에 따라 다르지만, 구조적으로 한국어 자동 자막이 부정확한 이유는 몇 가지가 있습니다.

  1. 구글의 한국어 ASR 모델이 다소 오래되었음. OpenAI Whisper Large v3, Meta SeamlessM4T 등 2024~2025년에 공개된 최신 모델보다 정확도가 낮은 편입니다.
  2. 한국어 특유의 변형에 약함. 조사·어미 변형, 사투리, 빠른 발화에 인식 오류가 잦습니다.
  3. 한국어 + 영어 코드 스위칭 처리가 약함. IT·스타트업·디자인 콘텐츠에서 영문 약어가 섞이면 잘못 인식되거나 발음 그대로 표기되는 경우가 많습니다.
  4. 배경 음악·소음에 정확도 급락. 브이로그·라이브·길거리 인터뷰처럼 배경 잡음이 큰 영상에서는 인식률이 50% 아래로 떨어지기도 합니다.
  5. 구두점·줄바꿈 거의 없음. 자동 자막은 한 줄에 단어가 쭉 이어져 있고 마침표·쉼표가 없어 가독성이 매우 낮습니다.

정확한 한국어 자막이 필요하면 자동 자막을 그대로 쓰지 말고, VexaScribe 같은 최신 Whisper 기반 도구로 음성을 다시 전사한 뒤 자막을 새로 만드는 것이 결과적으로 더 빠릅니다 — 수동 교정 시간이 훨씬 적게 듭니다.

VexaScribe로 정확한 한국어 자막 만들기 (3단계)

YouTube 영상의 음성을 VexaScribe에 올려 SRT/VTT로 내보내는 전체 과정입니다. 1시간 분량 영상 기준 약 5~10분이면 끝납니다.

  1. 1단계 — YouTube 영상 다운로드. 개인 학습·연구 용도로 영상을 본인 PC에 받습니다. 무료 도구로는 yt-dlp(개발자용), 4K Video Downloader(GUI 앱) 등이 있습니다. MP4 또는 MP3·M4A 음성만 추출해도 됩니다. 상업 용도라면 영상 저작권자의 허락이 필요할 수 있습니다.
  2. 2단계 — VexaScribe에 업로드. VexaScribe에 무료 가입(이메일만 필요, 신용카드 불필요) 후 대시보드에서 파일을 드래그 앤 드롭으로 올립니다. 언어는 \"Korean\"을 선택하거나 자동 감지에 맡겨도 됩니다. 처리 시간은 1시간 영상 기준 약 5~10분.
  3. 3단계 — SRT/VTT 내보내기. 전사가 끝나면 \"Export\" 메뉴에서 SRT 또는 VTT를 선택해 다운로드합니다. 본인 YouTube 영상이라면 YouTube Studio → 자막 → 파일 업로드로 끼울 수 있고, 영상 편집기(Premiere Pro·CapCut·DaVinci Resolve)에서도 그대로 가져올 수 있습니다.

팁: 자동 자막을 끄고 본인이 만든 정확한 SRT를 업로드하면 시청자 경험과 한국어 SEO 모두 개선됩니다 — YouTube는 자막 텍스트를 영상 검색 인덱싱에 활용합니다.

어떤 경우에 어떤 방법이 맞나? (실용 가이드)

본인의 영상 상황에 가장 가까운 항목을 찾아보세요. 모든 영상에 VexaScribe가 필요한 것은 아닙니다.

한국어 영상 자막을 빠르게 텍스트로 받고 싶음

→ YouTube 자체 다운로드 (무료). \"스크립트 표시\"로 복사 → 붙여넣기가 가장 빠릅니다. AI 도구는 과합니다.

SRT/VTT 파일이 필요하고 자막이 이미 있음

→ DownSub·SaveSubs 같은 무료 사이트. 가입 없이 URL만 붙여넣으면 SRT/VTT 파일을 즉시 받을 수 있습니다.

자막이 아예 없는 영상에 자막 필요

→ VexaScribe. YouTube가 자막을 제공하지 않으면 외부 다운로더로도 받을 수 없습니다. AI 재전사가 유일한 방법입니다.

자동 자막이 부정확해서 그대로 못 씀

→ VexaScribe. 60~75%짜리 자동 자막을 직접 고치는 것보다 88~93%짜리를 새로 받아 부분 교정하는 쪽이 시간이 훨씬 적게 듭니다.

영상 편집에 SRT를 가져와서 자막 트랙으로 쓰기

→ VexaScribe 또는 무료 다운로드 사이트. 원본 자막이 정확하면 무료 사이트로 충분합니다. 부정확하거나 화자 라벨이 필요하면 VexaScribe.

한국어 + 영어 혼합 IT/외국계 영상

→ VexaScribe. Whisper 다국어 모델은 코드 스위칭에 강합니다. YouTube 자동 자막은 영어 약어를 한글 발음으로 잘못 적는 경우가 많아 이런 영상에서 특히 약합니다.

인터뷰·팟캐스트·다인 대담 영상 (화자 표시 필요)

→ VexaScribe. YouTube와 무료 다운로더는 화자 분리를 거의 지원하지 않습니다. \"화자 1\", \"화자 2\"로 자동 나뉜 자막이 필요하면 AI 도구가 사실상 유일한 선택지입니다.

남의 영상 자막을 상업 콘텐츠에 그대로 활용

→ 먼저 저작권 확인. 어떤 방법을 쓰든 한국 저작권법상 영상 자막은 저작물입니다. 비상업적 학습·연구 용도가 아니면 영상 제작자의 허락을 먼저 받으세요.

Frequently Asked Questions

유튜브 자막을 직접 다운로드하려면 어떻게 하나요?

PC에서 가장 빠른 방법은 YouTube 자체 기능을 쓰는 것입니다. 영상 아래 "..." 메뉴를 열고 "스크립트 표시(Show transcript)"를 누르면 우측에 시간코드와 함께 자막이 펼쳐집니다. 그 내용을 마우스로 드래그해 복사하면 TXT로 바로 옮길 수 있습니다. SRT나 VTT 파일 형식으로 받고 싶다면 DownSub·SaveSubs 같은 무료 사이트에 영상 URL을 붙여넣으면 됩니다. 자막을 영상 제작자가 직접 올렸거나 자동 자막이 켜져 있어야 가능합니다.

YouTube 자동 자막과 정식 자막의 차이는 무엇인가요?

정식 자막은 영상 제작자(또는 커뮤니티 기여자)가 직접 작성하거나 검수한 자막입니다. 맞춤법·구두점·고유명사가 정확합니다. 자동 자막은 구글의 ASR(음성 인식)이 자동 생성한 것으로, 한국어 기준 정확도는 약 60~75% 수준입니다. 고유명사·약어·기술 용어·억양에 약하고 구두점이 거의 없습니다. 영상에 빨간색 "자동 생성됨" 라벨이 붙어 있으면 자동 자막입니다. 자막 품질이 콘텐츠 활용에 중요하다면 자동 자막을 그대로 쓰지 말고 VexaScribe 같은 최신 Whisper 기반 도구로 다시 전사하는 것이 좋습니다.

DownSub 같은 무료 자막 다운로드 사이트는 안전한가요?

DownSub, SaveSubs, KeepSubs 등은 수년간 운영되어 온 무료 서비스이며 일반적으로 안전합니다. 다만 광고가 공격적인 사이트가 많고, 일부 사이트는 다운로드 버튼처럼 위장한 광고를 노출합니다. 가짜 "Download" 버튼을 클릭하지 않도록 주의하세요. 또한 이 사이트들은 YouTube 자체가 제공하는 자막 데이터를 그대로 가져오는 구조이므로 자막 정확도는 YouTube 원본과 동일합니다. 자막 품질이 향상되지는 않습니다. 상업 용도로 자막을 활용한다면 YouTube 서비스 약관과 영상 저작권을 별도로 확인하세요.

한국어 자동 자막은 왜 부정확한가요?

주된 이유는 4가지입니다. (1) 구글의 한국어 ASR 모델이 OpenAI Whisper Large v3 같은 최신 모델보다 다소 오래되었습니다. (2) 한국어 특유의 조사·어미 변형, 사투리, 억양에 약합니다. (3) IT·의학·법률 등 도메인별 전문 용어가 영문 약어로 섞이면 코드 스위칭 처리가 자주 실패합니다. (4) 배경 음악·소음이 있는 브이로그·라이브 영상에서는 정확도가 더 떨어집니다. 정확한 한국어 자막이 필요하면 VexaScribe 같은 Whisper 기반 AI 도구로 음성을 재전사하는 것이 가장 빠른 해결책입니다.

VexaScribe로 만든 SRT 자막을 YouTube에 다시 업로드할 수 있나요?

예, 가능합니다. VexaScribe에서 SRT 또는 VTT로 내보낸 파일은 YouTube Studio의 "자막" 메뉴에서 그대로 업로드할 수 있습니다. 본인 채널이라면 YouTube Studio → 콘텐츠 → 해당 영상 → 자막 → 언어 추가(한국어) → 파일 업로드(.srt 또는 .vtt)를 따라가면 됩니다. 자동 자막을 끄고 본인이 만든 정확한 자막을 표시할 수 있어 시청자 경험과 검색 노출 모두에 유리합니다.

남의 영상 자막을 다운로드해도 저작권 문제가 없나요?

개인적인 학습·메모·번역 연구 등 비상업적 용도에서는 일반적으로 fair use(공정 이용) 범주에 들어가는 경우가 많습니다. 다만 자막을 그대로 재배포하거나, 자막을 기반으로 영상을 다시 만들어 업로드하거나, 상업 콘텐츠에 그대로 사용하는 것은 저작권 침해가 될 수 있습니다. 한국 저작권법은 영상의 자막도 영상 저작물의 일부로 보호합니다. 의심스러우면 영상 제작자에게 직접 사용 허락을 받는 것이 안전합니다. YouTube 서비스 약관도 자동 다운로드 도구 사용에 대해 명시적으로 제한을 두고 있으니 함께 확인하세요.

SRT와 VTT의 차이는 무엇인가요?

둘 다 시간코드와 텍스트를 짝지은 자막 파일 형식이지만 호환성이 다릅니다. SRT(SubRip)는 가장 오래되고 호환성이 넓은 형식으로, Premiere Pro·Final Cut Pro·CapCut·VLC 등 거의 모든 도구가 지원합니다. VTT(WebVTT)는 웹 환경(HTML5 비디오·YouTube·Vimeo)을 위해 설계된 신형 포맷으로, 글자 색·위치·스타일 지정이 가능합니다. 영상 편집기에서 작업할 거면 SRT, 웹 플레이어에 직접 끼울 거면 VTT를 선택하면 됩니다. VexaScribe는 두 형식 모두 내보내기를 지원합니다.

CapCut 같은 영상 편집기에 자막을 가져오는 방법은?

CapCut PC 버전 기준: 새 프로젝트 생성 → 영상 가져오기 → 좌측 메뉴에서 "자막(Captions)" → "가져오기(Import captions)" → SRT 파일 선택하면 타임라인에 자막 트랙이 자동으로 깔립니다. Premiere Pro의 경우 "파일 → 가져오기" 후 SRT를 캡션 트랙으로 드래그하면 됩니다. DaVinci Resolve는 "미디어 풀"에 SRT를 추가한 뒤 타임라인의 자막 트랙으로 드래그합니다. 모바일 CapCut은 "텍스트 → 자동 자막" 기능을 사용하거나 SRT 파일을 디바이스에 저장한 뒤 가져오기로 추가할 수 있습니다.

자막에 화자 표시(누가 말했는지)도 넣을 수 있나요?

YouTube 자체 자막과 무료 자막 다운로드 사이트는 화자 분리(speaker diarization)를 거의 지원하지 않습니다. 대화형 영상(인터뷰·팟캐스트·다인 토론)의 자막에 "화자 1", "화자 2" 또는 실제 이름을 자동으로 붙이고 싶다면 VexaScribe 같은 AI 도구가 필요합니다. VexaScribe는 업로드한 음성을 분석해 화자별로 구간을 나누고 이름을 직접 지정할 수 있게 해줍니다. 그 결과를 SRT로 내보내면 각 자막 라인에 화자 라벨이 포함됩니다.

자막 없는 영상이면 — 지금 무료로 시작하기

YouTube 자체 다운로드와 DownSub로 해결 안 되는 영상은 VexaScribe가 답입니다. 30분 무료 체험으로 직접 비교해보세요. 신용카드 등록 불필요.

무료로 시작 →