동영상 자막 추출

동영상 미리보기

동영상 파일을 끌어놓거나 클릭하여 선택

추출된 자막

자막 추출 준비 완료

오디오를 추출하고 음성을 자동으로 텍스트로 변환합니다.

영상 전사 소개

Vidxt는 영상에서 오디오 트랙을 추출해 음성을 깔끔한 타임코드 전사본으로 변환합니다. 결과물은 일반 텍스트, 자막, 번역의 출발점으로 활용할 수 있으며 모든 과정이 브라우저 안에서 이루어집니다.

MP4, MOV, AVI, MKV, WebM, FLV 파일을 처리하며 짧은 화면 녹화부터 몇 시간짜리 콘퍼런스 발표까지 다룰 수 있습니다. 화자의 휴지, 문장 경계, 구두점이 자동으로 추론되어 전사본이 읽기 좋게 유지됩니다.

이런 분께 추천합니다

  • 모든 강의에 검색 가능한 전사본과 SRT 자막을 제공해 학습자가 클립 전체를 보지 않고도 훑어보고 이동하고 복습할 수 있도록 하려는 강좌 제작자와 트레이너.
  • 웨비나, 데모 영상, 고객 인터뷰를 블로그 글, 소셜 컷, 사내 참고 자료로 재구성하는 마케팅·제품 팀.
  • 인터뷰 영상을 토대로 러프 컷을 짜면서 발언을 빠르게 찾기 위해 스크립트 형식의 화면이 필요한 다큐멘터리 제작자, 영상 편집자, 유튜버.
  • 기존 영상 라이브러리에 자막을 추가해 법적 요건을 충족하고 음소거로 시청하는 사용자에게도 콘텐츠를 전달하려는 접근성 중시 퍼블리셔.

영상 전사 방법

  1. 1MP4, MOV, AVI, MKV, WebM, FLV 파일을 업로드합니다. 데스크톱은 최대 2GB, 모바일은 최대 500MB까지 지원하며 드래그 앤 드롭과 일반 파일 선택기 모두 사용할 수 있습니다.
  2. 2발화 언어를 선택하거나 깨끗한 스튜디오 녹음이라면 자동 감지로 두어도 됩니다. 수동으로 지정하면 억양 있는 음성이나 짧은 클립의 정확도가 보통 향상됩니다.
  3. 3전사를 실행합니다. 완료되면 타임스탬프와 함께 텍스트를 검토한 뒤, 일반 텍스트나 SRT 자막으로 내보내거나 편집기로 바로 복사하세요.

지원하는 영상 포맷

주요 컨테이너를 모두 지원합니다: MP4, MOV, AVI, MKV, WebM, FLV. FFmpeg WebAssembly로 로컬에서 디코딩하고 오디오 트랙만 추출해 음성 엔진에 전달하므로, 이러한 컨테이너 안의 다소 드문 코덱도 대체로 정상 동작합니다.

영상은 브라우저 안에 머뭅니다

디먹싱과 오디오 추출은 원격 서버가 아닌 사용자의 기기에서 실행됩니다. 음성 모델로 전송되는 것은 추출된 오디오뿐이며, 전사본이 생성되면 즉시 폐기되므로 비공개 인터뷰나 미공개 영상이 클라우드 스토리지에 쌓이지 않습니다.

자주 묻는 질문

일반 텍스트뿐 아니라 SRT 자막도 받을 수 있습니까?

네. 전사 후 타임스탬프가 포함된 SRT 파일을 내보낼 수 있으며, 어떤 영상 플레이어나 NLE에서도 불러올 수 있습니다. 스크립트나 기사 형식의 내용만 필요하다면 일반 텍스트로 복사할 수도 있습니다.

화면 녹화나 웨비나에서도 사용할 수 있습니까?

가능합니다. 발화 오디오가 어느 정도 또렷하다면 화면 녹화, Zoom 내보내기, 웨비나 다시 보기 모두 잘 전사됩니다. 다중 화자도 처리되지만 화자 라벨 자체는 자동으로 지정되지 않습니다.

영상이 2GB를 넘으면 어떻게 해야 합니까?

비트레이트를 낮춰 파일을 압축하거나 짧은 구간으로 잘라 각각 전사하세요. 매우 긴 발표라면 짧은 세그먼트가 워크플로 안에서 병렬로 처리되므로 보통 이쪽이 더 빠릅니다.

별도 설치가 필요합니까?

아니요. Vidxt는 Chrome, Edge, Firefox, Safari를 포함한 최신 브라우저에서 모두 동작합니다. 플러그인이나 데스크톱 앱, 커맨드라인 설정이 필요 없으므로 어떤 노트북에서든 영상을 전사할 수 있습니다.