视频文稿提取

视频预览

拖拽或点击选择视频文件

提取文稿

等待开始提取文稿

自动提取音频并识别语音内容

关于视频转文字

Vidxt 会从视频里抽出音轨，再把里面的人声转成带时间码的逐字稿。结果可以直接当文稿用，也可以做成字幕，或者作为后续翻译、剪辑的起点，全程不用离开浏览器。

工具支持 MP4、MOV、AVI、MKV、WebM 和 FLV 等常见格式，几分钟的录屏到几个小时的会议视频都能处理，断句、标点和语气停顿会被自动推断，让转出来的文字读起来更顺。

常见容器格式都覆盖：MP4、MOV、AVI、MKV、WebM、FLV。工具通过 FFmpeg WebAssembly 在本地解码，先把音轨抽出来再交给语音引擎，所以容器里包的冷门编码大部分情况下也能正常处理。

拆容器和抽音轨都在本机完成，不走服务器中转。只有抽出来的音频会送到语音模型那一次，转写结束后立即丢弃，机密访谈、未发布的成片不会在云端留下任何副本。

可以。转写完成后能直接导出带时间码的 SRT 文件，几乎所有播放器和剪辑软件都支持。如果只需要文稿做文章，也可以选择纯文本格式复制走。

可以。只要人声清晰，录屏、Zoom 导出、网络研讨会回放都能转得不错。支持多人对话，但目前不会自动为不同说话人打标签，需要的话要手动区分。

可以先降低码率压一下，或者按章节剪成几段分别转写。长视频拆短段处理通常反而更快，每段也更容易在编辑器里逐段校对、组合使用。

不用。整套流程在现代浏览器里跑，Chrome、Edge、Firefox、Safari 都可以，不需要插件、桌面客户端或命令行，临时换台电脑也能继续用。