Извлечение транскрипта аудио

Предпросмотр аудио

Выберите аудиофайл

Транскрипт

Готов извлечь транскрипт

Мы распознаем речь в вашем аудиофайле.

О транскрипции аудио

Vidxt превращает устную речь в читаемый и доступный для поиска текст прямо в вашем браузере. Загрузите интервью, лекцию, подкаст или голосовую заметку и получите чистую расшифровку, которую можно скопировать, отредактировать или экспортировать за считаные минуты.

Распознавание речи выполняется по вашему файлу с помощью высокоточного движка, который работает с английским, китайским, японским, корейским и рядом других языков. Пунктуация и регистр восстанавливаются автоматически, поэтому результат больше похож на естественный текст, а не на сплошной поток слов.

Для кого это

Журналисты и исследователи, которым нужно точно цитировать интервью и иметь текстовую версию для поиска, чтобы не перематывать аудио в поисках нужной цитаты.
Студенты и учёные, которые превращают записи лекций или семинаров в заметки, учебные конспекты или цитаты, не перепечатывая всё вручную.
Подкастеры и создатели контента, которые делают шоу-ноуты, посты в блог или короткие соцклипы из уже вышедших эпизодов, чтобы повысить находимость и переиспользование контента.
Команды, которые разбирают звонки с клиентами, пользовательские интервью или внутренние встречи и хотят иметь письменную запись, которой можно делиться, комментировать её или передавать в другие инструменты.

Как транскрибировать аудиофайл

1Перетащите файл MP3, WAV, M4A, AAC, FLAC или OGG в область загрузки или кликните, чтобы выбрать его с устройства. Поддерживаются файлы до 2 ГБ на десктопе и 500 МБ на мобильном.
2Выберите язык речи, чтобы движок применил правильную акустическую модель. Автоопределение работает для большинства чистых записей, но указание языка помогает с акцентами и короткими фрагментами.
3Запустите транскрипцию и дождитесь результата. По завершении просмотрите текст, исправьте имена или термины, затем скопируйте его или экспортируйте как простой текст или субтитры SRT.

Поддерживаемые аудиоформаты

Vidxt принимает распространённые аудиоформаты, которые у вас действительно есть на диске: MP3, WAV, M4A, AAC, FLAC и OGG. Если у вас вместо аудио видео, его можно прогнать через инструмент транскрипции видео, который автоматически извлечёт звуковую дорожку перед распознаванием речи.

Ваши файлы остаются на устройстве

Декодирование и предобработка происходят локально с помощью FFmpeg, скомпилированного в WebAssembly. Аудио отправляется в речевой движок только на те секунды, что нужны для генерации текста, и после этого ничего не сохраняется на наших серверах, так что чувствительные записи не лежат в облачном хранилище.

Часто задаваемые вопросы

Насколько точна транскрипция?

На чистом аудио с одним говорящим можно рассчитывать на точность по словам выше 90%. Фоновый шум, сильные акценты, перекрывающиеся голоса или записи с низким битрейтом снижают её, поэтому быстрая вычитка по-прежнему имеет смысл.

Какие языки поддерживаются?

Английский, упрощённый и традиционный китайский, японский, корейский, испанский, французский, немецкий, португальский и ряд других. Записи на нескольких языках работают, но обычно надёжнее всего, когда один язык явно доминирует.

Есть ли ограничение по длительности?

Размер файла ограничен 2 ГБ на десктопе и 500 МБ на мобильном, чего хватает для многочасовых записей в обычных битрейтах. Очень длинные файлы обрабатываются дольше; разбиение их на главы часто даёт более быстрый и управляемый результат.

Можно ли пользоваться бесплатно?

Да. Повседневная транскрипция бесплатна, для коротких фрагментов регистрация не нужна. Активные пользователи, которые часто обрабатывают длинные файлы, могут перейти на платный план с более высокими месячными лимитами и приоритетной обработкой.