Transkription Kostenlos — 6 Echt Gratis Tools im Test
Wirklich kostenlos sind nur wenige. Die meisten 'kostenlosen' Tools haben versteckte Limits, erfordern eine Kreditkarte oder sind nur kostenlose Testversionen. Hier sind 6 Optionen, die 2026 noch echt gratis sind — mit DSGVO-Hinweisen und einer Bonus-Anleitung für Whisper-Lokalinstallation (100% gratis, 100% privat).
Schnelle Antwort — Welches Tool für welchen Zweck?
| Ihr Anwendungsfall | Empfohlenes Tool | Kostenlose Minuten |
|---|---|---|
| Gelegentliche deutsche Audiotranskription | VexaScribe Free | 30 Min/Monat |
| Viel englisches Audio (Podcasts, Meetings) | Otter Free | 300 Min/Monat (nur EN) |
| Maximale Datenschutz-Anforderungen | Whisper lokal | Unbegrenzt |
| Notizen während Besprechungen tippen | Word/Google Docs Diktat | Unbegrenzt (live) |
| Vor Kauf testen | amberscript Free | 10 Min Testversion |
Kostenlos vs. Kostenlose Testversion — Der Unterschied
Vor dem Vergleich der Tools muss man eine wichtige Unterscheidung treffen:
✅ Kostenlos (Free Tier)
Dauerhaft kostenlos mit Limits (z.B. 30 Min/Monat). Keine Kreditkarte erforderlich. Nutzbar so lange Sie wollen.
⚠️ Kostenlose Testversion (Free Trial)
Begrenzte Tage oder Minuten gratis, dann Kreditkarte erforderlich. Wenn Sie vergessen zu kündigen, werden Sie automatisch belastet.
Diese Seite konzentriert sich hauptsächlich auf echte Free-Tier-Tools. amberscript ist ein Beispiel für ein Tool mit nur Free Trial, das wir der Vollständigkeit halber auflisten.
6 Wirklich Kostenlose Transkriptions-Tools
1. VexaScribe Free — 30 Min/Monat
Type: Echtes Free Tier (keine Kreditkarte)
Stärken: Alle 99 Sprachen im Free-Tier verfügbar (Deutsch erstklassig unterstützt). Automatische Sprechererkennung. Export als TXT/DOCX/SRT/PDF. Verschlüsselung in Transit und Speicherung. Löschung jederzeit möglich.
Schwächen: 30 Min/Monat ist deutlich weniger als Otter Free (300 Min). Für regelmäßige Nutzung schnell zu wenig.
Wann sinnvoll: Sie brauchen gelegentlich deutsche Transkription mit Komfort-Features wie Sprechererkennung und mehreren Exportformaten.
2. Otter.ai Free — 300 Min/Monat (nur Englisch)
Type: Echtes Free Tier (Anmeldung erforderlich)
Stärken: Großzügige 300 Minuten/Monat. Beste In-Live-Diktat-Qualität auf Englisch. Integriert mit Zoom, Slack, Salesforce. Mature Produkt seit 2016.
Schwächen: Im Free-Tier nur Englisch. Deutsche Transkription erst ab dem $16.99/Monat Pro-Plan. UI komplett auf Englisch. US-Server (DSGVO-Hinweis: prüfen Sie deren Datenschutzerklärung).
Wann sinnvoll: Sie transkribieren hauptsächlich englischsprachiges Audio (Podcasts, internationale Meetings).
3. Microsoft Word — Diktieren-Funktion
Type: Im Microsoft 365 enthalten (auch in Free-Versionen Word Online)
Stärken: Live-Diktat direkt in Word-Dokumente. Funktioniert in Browser (Word Online) und Desktop. Deutsche Spracherkennung gut. DSGVO: Microsoft 365 in EU-Region verfügbar.
Schwächen: Funktioniert nur als Live-Diktat, nicht für Datei-Transkription. Sie können keine MP3 oder M4A hochladen. Nur für Echtzeit-Spracheingabe.
Wann sinnvoll: Sie möchten Texte sprechen statt tippen (Notizen, E-Mails, Berichte erstellen).
4. Google Docs Spracheingabe
Type: Kostenlos mit Google-Konto
Stärken: Funktioniert direkt im Chrome-Browser. Solide deutsche Spracherkennung (Google ist eines der größten Sprachmodelle weltweit). Kein Setup nötig.
Schwächen: Wie Microsoft Word: nur Live-Diktat, keine Datei-Transkription möglich. DSGVO: Audio wird in Google-Clouds verarbeitet (per default US, EU-Datenstandorte teilweise verfügbar). Funktioniert nur in Chrome.
Wann sinnvoll: Notizen während Sitzungen, gesprochene Drafts für Texte.
5. OpenAI Whisper (Lokalinstallation) — 100% Privat ⭐
Type: Open-Source, lokal installiert
Stärken: Komplett kostenlos und unbegrenzt nutzbar. 100% privat — keine Daten verlassen Ihren Computer (perfekt für sensible Daten wie juristische, medizinische oder vertrauliche Geschäftsaudios). Modellqualität gleich wie viele kostenpflichtige Tools (Whisper Large-v3 ist das Basismodell vieler kommerzieller Lösungen, einschließlich Teile von VexaScribe).
Schwächen: Technische Einrichtung erforderlich (Python, Befehlszeile). Ohne GPU langsam (5-10x langsamer als Echtzeit). Keine grafische Oberfläche standardmäßig. Keine Sprechererkennung integriert (zusätzliche Tools wie pyannote nötig).
Wann sinnvoll: Datenschutz-sensible Berufe (Anwälte, Ärzte, Therapeuten). Wer einmal Python-Setup macht und dann unbegrenzt nutzt.
6. amberscript Free — Nur 10 Min Testversion
Type: Nur Free Trial (kein dauerhaftes Free Tier!)
Stärken: Niederländisches Unternehmen, EU-Server (DSGVO-freundlich). Gute deutsche Spracherkennung. Professionelle UI. Auch mit menschlicher Transkription kombinierbar.
Schwächen: Kein dauerhaftes Free Tier — nur 10 Minuten Testversion, danach kostenpflichtig (ab ~10€/Stunde Audio). Wenn Sie regelmäßig transkribieren, schnell teuer.
Wann sinnvoll: Sie wollen ein professionelles Tool testen, bevor Sie zahlen.
DSGVO-Vergleich der Kostenlosen Tools
DSGVO-Konformität ist kein einfaches Label. Hier ist, was Sie wissen müssen:
| Tool | Serverstandort | Verschlüsselung | Löschrecht | DSGVO-Status |
|---|---|---|---|---|
| Whisper lokal | Ihr Computer | N/A (lokal) | Jederzeit | ★★★★★ |
| amberscript | EU (NL) | Ja | Auf Anfrage | ★★★★ |
| VexaScribe | US/EU | Ja | Jederzeit | ★★★ |
| Microsoft Word | EU verfügbar | Ja | Über M365 Settings | ★★★ |
| Google Docs | US (EU optional) | Ja | Google Konto | ★★ |
| Otter.ai | US | Ja | Auf Anfrage | ★★ |
Wichtig: "DSGVO-konform" bedeutet nicht das gleiche bei allen Anbietern. Für sensible Daten (juristisch, medizinisch, Personalakten) ist Whisper lokal die sicherste Wahl. Für allgemeine Geschäftsnutzung sind EU-basierte Anbieter wie amberscript ideal. Bei US-Anbietern prüfen Sie die Datenschutzerklärung und das EU-US Data Privacy Framework.
Bonus: Whisper Lokal Installieren — Schritt für Schritt
Whisper von OpenAI ist Open Source und kann auf Ihrem eigenen Computer installiert werden. Das ist die privateste und langfristig kostenloseste Option, erfordert aber etwas technisches Setup. Hier die Anleitung:
Voraussetzungen
- Python 3.9 oder neuer (kostenloser Download von python.org)
- ~5 GB freier Speicherplatz für das large-v3 Modell
- GPU optional, aber 2-3x schneller (NVIDIA mit CUDA)
- Grundkenntnisse Befehlszeile
Installation (5 Schritte)
- Terminal/Eingabeaufforderung öffnen
- Befehl:
pip install openai-whisper - FFmpeg installieren (für Audio-Dekodierung):
brew install ffmpeg(Mac) oderchoco install ffmpeg(Windows) - Erste Transkription:
whisper audio.mp3 --language German --model large-v3 - Ergebnis erscheint als .txt und .srt Datei im gleichen Ordner
Welches Modell wählen?
Whisper hat 5 Modellgrößen — je größer, desto genauer, aber langsamer:
tiny— sehr schnell, niedrige Qualitätbase— schnell, OK für klare Sprachesmall— ausgewogen, gut für die meisten Anwendungenmedium— gut für Deutsch mit Akzentenlarge-v3— beste Qualität, langsamster (empfohlen)
Mehr Details: github.com/openai/whisper. Detaillierte Genauigkeitsdaten pro Sprache in unserer Whisper-Genauigkeitsanalyse.
Wann Reichen Kostenlose Tools NICHT Mehr Aus?
Free-Tier-Tools sind großartig für gelegentliche Nutzung, aber haben Grenzen:
- • Lange Aufnahmen (>30 Min regelmäßig) — Free-Tier-Limits werden schnell überschritten
- • Mehrere Sprecher mit automatischer Identifikation — Sprechererkennung ist meistens Premium-Feature
- • Stundenlange Vorlesungen oder Meetings — Whisper lokal ist OK, Cloud-Free-Tier nicht
- • Sensible Daten — nur Whisper lokal bietet 100% Datenschutz
- • Tägliche Berufsnutzung — selbst Otters 300 Min reichen nicht
- • Bulk-Upload mehrerer Dateien gleichzeitig — Free-Tools verarbeiten einzeln
Wenn Sie diese Grenzen erreichen, beginnen kostenpflichtige Pläne oft ab nur 2-15$/Monat. Probieren Sie VexaScribes Free-Tier (30 Min) und entscheiden Sie dann, ob ein Upgrade Sinn macht.
Mythos: "Kostenlose Tools Sind Immer Schlechter"
Das stimmt nur teilweise. Whisper lokal nutzt dasselbe KI-Modell (Large-v3) wie viele kostenpflichtige Cloud-Dienste — die Modellqualität ist identisch.
Was kostenpflichtige Tools besser machen, sind Komfort-Features:
- Automatische Sprechererkennung ohne manuelle Konfiguration
- KI-Zusammenfassungen mit Action Items
- Integration mit Zoom, Slack, Salesforce
- Schöne UI ohne Befehlszeilen-Setup
- Cloud-Verarbeitung (keine eigene Hardware nötig)
- Bulk-Upload, Team-Sharing, automatische Backups
Wer nur Text aus Audio braucht und etwas Setup-Zeit investieren kann, kommt mit Whisper lokal sehr weit — mit identischer Modellqualität.
Häufige Fragen — Kostenlose Transkription
Welche Datei-Formate sind kostenlos transkribierbar?
Die meisten kostenlosen Tools unterstützen MP3, WAV, M4A und MP4. Whisper (lokal installiert) unterstützt zusätzlich OGG, FLAC, WebM und nahezu alle Audioformate. Browser-Tools wie Google Docs Spracheingabe oder Microsoft Word Diktieren funktionieren nur mit Live-Mikrofoneingabe, nicht mit Dateien. VexaScribes Free-Tier unterstützt alle gängigen Formate (MP3, WAV, M4A, FLAC, OGG, MP4, MOV).
Wie lange dauert kostenlose Transkription?
Cloud-basierte Tools (VexaScribe, Otter, amberscript) brauchen typischerweise 5-10 Minuten für eine Stunde Audio. Whisper lokal hängt von der Hardware ab: mit GPU 2-3x schneller als Echtzeit, ohne GPU 5-10x langsamer (eine Stunde Audio kann mehrere Stunden dauern). Live-Diktat-Tools (Word, Google Docs) arbeiten in Echtzeit.
Was passiert mit meinen Daten bei kostenlosen Tools?
Das variiert stark. Cloud-Tools verarbeiten Ihre Audiodaten auf Servern (oft in den USA bei Otter, in der EU bei amberscript). VexaScribe verschlüsselt Übertragung und Speicherung und ermöglicht Löschung jederzeit. Google und Microsoft verarbeiten Spracheingabe in ihren Clouds. Die einzige 100% private Option ist Whisper lokal — keine Daten verlassen Ihren Computer.
Kann ich Sprecher in kostenlosen Tools identifizieren?
Sprecherkennung (Diarisierung) ist meistens ein Premium-Feature. Otter Free, VexaScribe Free und Whisper lokal (mit zusätzlichen Tools wie pyannote) bieten begrenzte oder keine automatische Sprecheridentifikation. Für hochwertige Sprecherkennung brauchen Sie in der Regel einen kostenpflichtigen Plan.
Ist Whisper wirklich 100% kostenlos?
Ja. OpenAI hat Whisper als Open-Source-Modell unter der MIT-Lizenz veröffentlicht. Sie können es kostenlos von GitHub herunterladen, lokal installieren und unbegrenzt nutzen. Die einzigen Kosten sind Stromverbrauch und (optional) Cloud-GPU-Miete, wenn Sie auf eigener Hardware nicht genug Leistung haben. Quellcode: github.com/openai/whisper.
Wie DSGVO-konform sind diese Tools?
DSGVO-Konformität ist kein einfaches Label. Whisper lokal ist die einzige Option mit 100% DSGVO-Konformität, da keine Daten verlassen Ihren Computer. amberscript (NL) verarbeitet in der EU. VexaScribe verschlüsselt Übertragung und Speicherung mit Löschungsrecht. Otter, Microsoft und Google verarbeiten oft in den USA — DSGVO-Konformität ist möglich, aber Sie sollten die Datenschutzerklärung jedes Anbieters prüfen.
Wann lohnt sich ein Upgrade auf einen kostenpflichtigen Plan?
Wenn Sie regelmäßig mehr als 30-60 Minuten pro Monat transkribieren, automatische Sprechererkennung brauchen, mehrere Sprachen kombinieren oder Komfort-Features (Zusammenfassungen, Integrationen, Bulk-Upload) benötigen. Für berufliche Tägliche Nutzung sind kostenpflichtige Pläne ab ~2-15$/Monat oft günstiger und produktiver als die Lokalinstallation von Whisper.
Gibt es ein gutes kostenloses Tool ohne Anmeldung?
Komplett ohne Anmeldung: Google Docs Spracheingabe (mit Google-Konto, aber kostenlos für Spracheingabe) und Microsoft Word Online Diktieren-Funktion. Beide arbeiten nur live, nicht mit Dateien. Für Datei-Transkription verlangen die meisten Tools eine Anmeldung — Whisper lokal ist die Ausnahme, erfordert aber technische Einrichtung.
Brauchen Sie Mehr als 30 Minuten?
Wenn das Free-Tier nicht reicht und Sie Komfort-Features wie automatische Sprechererkennung, KI-Zusammenfassungen und Bulk-Upload brauchen, beginnt VexaScribe ab 2$/Monat. Für vollkommene Privatsphäre bleibt Whisper-Lokalinstallation die beste Wahl.
Kostenlos Starten →Verwandte Seiten
Audio Transkribieren
Die Haupt-Transkriptionsfunktion: MP3, WAV, M4A und mehr mit KI-Genauigkeit.
MP3 in Text Umwandeln
MP3-Dateien in Sekunden in Text konvertieren mit KI.
Whisper Transkription
Whisper-basierte Transkription für Deutsch, mit Optionen für lokale Installation.
Whisper Genauigkeit pro Sprache
Echte WER-Daten von Whisper Large-v3 — inklusive Deutsch.