视频预览
拖拽或点击选择视频文件
提取文稿
等待开始提取文稿
自动提取音频并识别语音内容
Vidxt 会从视频里抽出音轨,再把里面的人声转成带时间码的逐字稿。结果可以直接当文稿用,也可以做成字幕,或者作为后续翻译、剪辑的起点,全程不用离开浏览器。
工具支持 MP4、MOV、AVI、MKV、WebM 和 FLV 等常见格式,几分钟的录屏到几个小时的会议视频都能处理,断句、标点和语气停顿会被自动推断,让转出来的文字读起来更顺。
常见容器格式都覆盖:MP4、MOV、AVI、MKV、WebM、FLV。工具通过 FFmpeg WebAssembly 在本地解码,先把音轨抽出来再交给语音引擎,所以容器里包的冷门编码大部分情况下也能正常处理。
拆容器和抽音轨都在本机完成,不走服务器中转。只有抽出来的音频会送到语音模型那一次,转写结束后立即丢弃,机密访谈、未发布的成片不会在云端留下任何副本。
可以。转写完成后能直接导出带时间码的 SRT 文件,几乎所有播放器和剪辑软件都支持。如果只需要文稿做文章,也可以选择纯文本格式复制走。
可以。只要人声清晰,录屏、Zoom 导出、网络研讨会回放都能转得不错。支持多人对话,但目前不会自动为不同说话人打标签,需要的话要手动区分。
可以先降低码率压一下,或者按章节剪成几段分别转写。长视频拆短段处理通常反而更快,每段也更容易在编辑器里逐段校对、组合使用。
不用。整套流程在现代浏览器里跑,Chrome、Edge、Firefox、Safari 都可以,不需要插件、桌面客户端或命令行,临时换台电脑也能继续用。