Bereit zum Extrahieren des Transkripts
Wir erkennen die Sprache in deiner Audiodatei.
Vidxt verwandelt gesprochene Audioinhalte direkt im Browser in lesbaren, durchsuchbaren Text. Lade ein Interview, eine Vorlesung, einen Podcast oder eine Sprachnotiz hoch, und du erhältst innerhalb weniger Minuten ein sauberes Transkript, das du kopieren, bearbeiten oder exportieren kannst.
Die Spracherkennung verarbeitet deine Datei über eine hochpräzise Engine, die Englisch, Chinesisch, Japanisch, Koreanisch und mehrere weitere Sprachen unterstützt. Interpunktion und Groß- und Kleinschreibung werden automatisch wiederhergestellt, sodass die Ausgabe nahezu wie ein natürlich verfasster Text wirkt und nicht wie eine endlose Wortkette.
Vidxt akzeptiert die gängigen Audioformate, die du tatsächlich auf der Festplatte hast: MP3, WAV, M4A, AAC, FLAC und OGG. Wenn deine Datei stattdessen ein Video ist, kannst du das Tool zur Videotranskription nutzen, das die Tonspur vor der Spracherkennung automatisch extrahiert.
Dekodierung und Vorverarbeitung laufen lokal über FFmpeg, das nach WebAssembly kompiliert wurde. Die Audiodaten werden nur für die wenigen Sekunden an die Sprach-Engine gesendet, die zur Texterzeugung nötig sind, und danach nirgendwo auf unseren Servern gespeichert. So liegen sensible Aufnahmen nicht in einem Cloud-Speicher.
Bei klaren Aufnahmen mit nur einer sprechenden Person kannst du eine Worterkennung von deutlich über 90 % erwarten. Hintergrundgeräusche, starke Akzente, sich überlappende Stimmen oder eine niedrige Bitrate verringern das, daher lohnt sich immer ein kurzer Korrekturdurchgang.
Englisch, vereinfachtes und traditionelles Chinesisch, Japanisch, Koreanisch, Spanisch, Französisch, Deutsch, Portugiesisch und einige weitere. Aufnahmen mit mehreren Sprachen funktionieren, sind aber am zuverlässigsten, wenn eine Sprache klar dominiert.
Die Dateigröße ist auf 2 GB am Desktop und 500 MB am Mobilgerät begrenzt, was bei üblicher Bitrate auch mehrstündige Aufnahmen abdeckt. Sehr lange Dateien dauern länger; eine Aufteilung in Kapitel ergibt oft eine schnellere und besser handhabbare Ausgabe.
Ja. Der tägliche Einsatz zur Transkription ist kostenlos, für kurze Clips ist nicht einmal eine Anmeldung nötig. Vielnutzer mit häufigen, langen Dateien können auf einen kostenpflichtigen Plan mit höheren Monatslimits und priorisierter Verarbeitung wechseln.