Trích xuất văn bản từ video

Xem trước video

Thả tệp hoặc bấm để chọn tệp video

Bản chép đã trích xuất

Sẵn sàng trích xuất bản chép

Chúng tôi sẽ trích xuất âm thanh và tự động chép lại lời nói.

Giới thiệu về phiên âm video

Vidxt trích xuất phần âm thanh từ video của bạn và chuyển giọng nói thành bản phiên âm gọn gàng có dấu thời gian. Bạn có thể dùng kết quả dưới dạng văn bản thuần, phụ đề hoặc làm điểm khởi đầu cho dịch thuật, tất cả ngay trong trình duyệt.

Công cụ xử lý các tệp MP4, MOV, AVI, MKV, WebM và FLV, từ một bản ghi màn hình ngắn cho tới một buổi hội thảo kéo dài nhiều giờ. Khoảng dừng của người nói, ranh giới câu và dấu câu được suy luận tự động để bản phiên âm luôn dễ đọc.

Phù hợp với ai

Người tạo khóa học và đào tạo viên muốn có bản phiên âm có thể tìm kiếm và phụ đề SRT cho từng bài học, để học viên có thể quét, nhảy đến đoạn cần và ôn lại mà không phải xem toàn bộ clip.
Các nhóm marketing và sản phẩm biến webinar, video demo và phỏng vấn khách hàng thành bài blog, clip mạng xã hội và tài liệu tham khảo nội bộ.
Nhà làm phim tài liệu, biên tập video và YouTuber dựng bản nháp từ tư liệu phỏng vấn, cần một chế độ xem dạng kịch bản để nhanh chóng tìm câu trích dẫn.
Các nhà xuất bản chú trọng khả năng tiếp cận, thêm phụ đề cho thư viện video sẵn có để đáp ứng yêu cầu pháp lý và phục vụ những người xem mở tiếng tắt.

Cách phiên âm một video

1Tải lên tệp MP4, MOV, AVI, MKV, WebM hoặc FLV, tối đa 2 GB trên máy tính hoặc 500 MB trên di động. Kéo thả đều được, hoặc dùng hộp chọn tệp thông thường.
2Chọn ngôn ngữ được nói, hoặc để chế độ tự động phát hiện cho các bản ghi studio sạch. Đặt thủ công thường giúp tăng độ chính xác với giọng có vùng miền hoặc đoạn ngắn.
3Chạy phiên âm. Khi hoàn tất, xem lại văn bản kèm dấu thời gian, sau đó xuất ra dạng văn bản thuần, phụ đề SRT hoặc sao chép thẳng vào trình biên tập của bạn.

Các định dạng video được hỗ trợ

Các container thông dụng đều được hỗ trợ: MP4, MOV, AVI, MKV, WebM và FLV. Công cụ giải mã cục bộ qua FFmpeg WebAssembly, tách phần âm thanh ra, rồi chỉ đưa âm thanh đó vào engine nhận dạng, nên ngay cả các codec không phổ biến nằm trong những container này thường vẫn hoạt động.

Video ở lại trong trình duyệt

Việc demux và trích xuất âm thanh chạy trên thiết bị của bạn, không phải trên máy chủ từ xa. Chỉ phần âm thanh đã trích xuất đi tới mô hình nhận dạng, và nó bị loại bỏ ngay khi bản phiên âm được tạo ra, nên các cuộc phỏng vấn bảo mật và tư liệu chưa phát hành không tích tụ trong kho lưu trữ đám mây.

Câu hỏi thường gặp

Tôi có thể lấy phụ đề SRT chứ không chỉ văn bản thuần?

Có. Sau khi phiên âm, bạn có thể xuất tệp SRT có dấu thời gian, dùng được trong bất kỳ trình phát video hay NLE nào. Bạn cũng có thể sao chép văn bản thuần nếu chỉ cần phiên bản kịch bản hoặc dạng bài viết của nội dung.

Công cụ có hoạt động với bản ghi màn hình và webinar không?

Có. Miễn là giọng nói tương đối rõ ràng, bản ghi màn hình, bản xuất Zoom và bản phát lại webinar đều được phiên âm tốt. Nhiều người nói cũng được xử lý, dù nhãn người nói không tự động được gán.

Nếu video của tôi lớn hơn 2 GB thì sao?

Bạn có thể nén tệp với bitrate thấp hơn, hoặc cắt thành các đoạn ngắn rồi phiên âm từng đoạn. Với các buổi nói chuyện rất dài, cách này thường nhanh hơn vì các đoạn ngắn có thể được xử lý song song trong luồng công việc của bạn.

Tôi có phải cài đặt gì không?

Không. Vidxt chạy hoàn toàn trong trình duyệt hiện đại, bao gồm Chrome, Edge, Firefox và Safari. Không cần plugin, không có ứng dụng desktop và không cần thiết lập dòng lệnh, nên bạn có thể phiên âm video từ bất kỳ máy tính xách tay nào đang có.