视频文稿提取

视频预览

拖拽或点击选择视频文件

提取文稿

等待开始提取文稿

自动提取音频并识别语音内容

关于视频转文字

Vidxt 会从视频里抽出音轨,再把里面的人声转成带时间码的逐字稿。结果可以直接当文稿用,也可以做成字幕,或者作为后续翻译、剪辑的起点,全程不用离开浏览器。

工具支持 MP4、MOV、AVI、MKV、WebM 和 FLV 等常见格式,几分钟的录屏到几个小时的会议视频都能处理,断句、标点和语气停顿会被自动推断,让转出来的文字读起来更顺。

适合谁用

  • 课程讲师和培训师:为每节课生成可搜索的文字稿和 SRT 字幕,学员可以快速跳读、复习,不必每次都从头看视频。
  • 市场和产品团队:把网络研讨会、产品演示、客户访谈转成博客、社媒短片素材和内部参考资料,复用率显著提高。
  • 纪录片和长视频创作者:剪辑前先拿到脚本式视图,方便快速搜索采访片段中的关键句子,省去反复回放的时间。
  • 无障碍内容运营:为已有视频库批量补字幕,满足合规要求,也照顾习惯静音观看的用户。

如何转写一段视频

  1. 1上传 MP4、MOV、AVI、MKV、WebM 或 FLV 视频,桌面端最大 2GB、移动端最大 500MB。可以拖拽,也可以从文件选择器里挑。
  2. 2指定视频中的主要语种,或者让工具自动识别。录音棚级别的清晰素材自动识别没问题,带口音或较短片段建议手动选语种以提高准确率。
  3. 3启动转写。完成后可以在页面里边对照时间码边检查文字,然后导出成纯文本、SRT 字幕,或直接复制到剪辑软件里使用。

支持的视频格式

常见容器格式都覆盖:MP4、MOV、AVI、MKV、WebM、FLV。工具通过 FFmpeg WebAssembly 在本地解码,先把音轨抽出来再交给语音引擎,所以容器里包的冷门编码大部分情况下也能正常处理。

视频不离开浏览器

拆容器和抽音轨都在本机完成,不走服务器中转。只有抽出来的音频会送到语音模型那一次,转写结束后立即丢弃,机密访谈、未发布的成片不会在云端留下任何副本。

常见问题

能直接拿到 SRT 字幕吗?

可以。转写完成后能直接导出带时间码的 SRT 文件,几乎所有播放器和剪辑软件都支持。如果只需要文稿做文章,也可以选择纯文本格式复制走。

录屏和网络会议视频能转吗?

可以。只要人声清晰,录屏、Zoom 导出、网络研讨会回放都能转得不错。支持多人对话,但目前不会自动为不同说话人打标签,需要的话要手动区分。

视频大于 2GB 怎么办?

可以先降低码率压一下,或者按章节剪成几段分别转写。长视频拆短段处理通常反而更快,每段也更容易在编辑器里逐段校对、组合使用。

需要安装什么软件吗?

不用。整套流程在现代浏览器里跑,Chrome、Edge、Firefox、Safari 都可以,不需要插件、桌面客户端或命令行,临时换台电脑也能继续用。