動画の文字起こし

動画プレビュー

ファイルをドロップ、またはクリックして動画を選択

抽出された文字起こし

文字起こしを開始する準備ができました

音声を自動で抽出し、文字起こしを行います。

動画文字起こしについて

Vidxt は動画から音声トラックを抽出し、音声をきれいなタイムコード付き文字起こしに変換します。結果はプレーンテキスト、字幕、翻訳の起点として活用でき、すべてブラウザ内で完結します。

MP4、MOV、AVI、MKV、WebM、FLV ファイルに対応し、短い画面録画から数時間のカンファレンス講演まで扱えます。話者の間、文の区切り、句読点は自動的に推定され、読みやすい文字起こしを維持します。

すべての授業に検索可能な文字起こしと SRT 字幕を用意し、受講者がクリップ全体を視聴せずにスキャン・ジャンプ・復習できるようにしたいコース制作者やトレーナーの方。
ウェビナー、デモ動画、顧客インタビューをブログ記事、ソーシャル用カット、社内資料に再構成したいマーケティングや製品チーム。
インタビュー素材から仮編集を組み立てるドキュメンタリー制作者、動画編集者、YouTuber の方で、発言を素早く探すためのスクリプトビューが必要な場合。
既存の動画ライブラリに字幕を追加して法的要件を満たし、音声オフで視聴する視聴者にも届けたい、アクセシビリティ重視のパブリッシャー。

1MP4、MOV、AVI、MKV、WebM、FLV ファイルをアップロードします。デスクトップは最大 2 GB、モバイルは最大 500 MB まで対応。ドラッグ&ドロップでも通常のファイル選択でも構いません。
2話されている言語を選択するか、スタジオ品質のクリーンな録音であれば自動検出のままで構いません。手動で指定すると、訛りのある音声や短いクリップでも精度が向上します。
3文字起こしを実行します。完了したらタイムスタンプとともにテキストを確認し、プレーンテキスト、SRT 字幕として書き出すか、エディタへ直接コピーします。

主要なコンテナに対応します：MP4、MOV、AVI、MKV、WebM、FLV。FFmpeg WebAssembly によりローカルでデコードし、音声トラックを取り出して音声エンジンに渡すため、コンテナ内のあまり一般的でないコーデックでも通常は動作します。

demux と音声抽出は端末上で実行され、リモートサーバーには送信されません。音声モデルに届くのは抽出された音声のみで、文字起こし生成後は破棄されるため、機密インタビューや未公開素材がクラウドストレージに蓄積することはありません。

はい。文字起こし後、タイムスタンプ付きの SRT ファイルを書き出せます。あらゆる動画プレーヤーや NLE に読み込めます。スクリプトや記事スタイルの内容だけが必要な場合はプレーンテキストとしてコピーすることもできます。

使えます。発話が比較的クリアであれば、画面録画、Zoom の書き出し、ウェビナーの再生などは問題なく文字起こしできます。複数話者にも対応しますが、話者ラベル自体は自動で付与されません。

ビットレートを下げて圧縮するか、短いセクションに分割してそれぞれを文字起こししてください。非常に長い講演ではこのほうが速いことが多く、短いセグメントはワークフロー内で並列処理できます。

いいえ。Vidxt は Chrome、Edge、Firefox、Safari を含むモダンブラウザで完結します。プラグインもデスクトップアプリもコマンドライン設定も不要なので、手元のどのノート PC からでも動画を文字起こしできます。