Was ist Whisper KI und warum ist sie wichtig?
Whisper ist OpenAIs modernste Spracherkennung. Im September 2022 veröffentlicht und als Open-Source freigegeben, wurde sie auf 680.000 Stunden mehrsprachiger Audiodaten trainiert. Das Ergebnis: eine der präzisesten Spracherkennungen weltweit — besonders stark bei Deutsch.
Das Problem: Whisper direkt zu nutzen erfordert technisches Wissen. Du musst Python installieren, Abhängigkeiten verwalten, mit der Kommandozeile arbeiten. Für die meisten Nutzer ist das unrealistisch.
Die Lösung: VoicePad AI verpackt Whisper in eine fertige App. Du installierst, sprichst, und der Text erscheint — in jeder App, systemweit. Kein Python, keine Kommandozeile, kein technisches Setup.
Whisper in VoicePad vs. ChatGPT vs. Raw Whisper
| Kriterium | VoicePad AI | ChatGPT Voice | Raw Whisper.cpp |
|---|---|---|---|
| Verarbeitung | 100% lokal | OpenAI-Server (USA) | 100% lokal |
| Installation | 1-Klick-Installer | ChatGPT-Abo nötig | Kommandozeile |
| Echtzeit-Diktat | ✅ in jeder App | Nur im Chat | ❌ nur Dateien |
| Kosten | Gründer: 0 € / Pro: ~50 € | $20/Monat | 0 € (aber Aufwand) |
| DSGVO | ✅ technisch konform | ⚠️ Daten in USA | ✅ lokal |
| Plattformen | Win+Mac+iOS+Android | Web/App | Terminal |
VoicePad kombiniert die Qualität von Whisper mit der Benutzerfreundlichkeit einer fertigen App — ohne die Datenschutz-Probleme von Cloud-Lösungen.
Was du als Gründungsmitglied bekommst
- Whisper Small — Das optimierte Modell für schnelle, präzise Diktate
- Whisper Medium (Pro) — Höhere Genauigkeit bei Fachvokabular
- Alle 4 Plattformen — Windows, Mac, iPhone, Android mit einer Lizenz
- Float Orb / VoicePad Direct — Diktieren in jeder App, systemweit
- Deutsches Fachwörterbuch — Medizin, Recht, Technik bereits integriert
- Lebenslange Updates — Neue Whisper-Versionen automatisch eingebaut
- WiFi-Sync — Wörterbuch zwischen Geräten synchronisieren
- Kein Abo, niemals — Einmal Gründungsmitglied, immer Pro
Technische Details für Entwickler
Modell-Architektur
VoicePad nutzt whisper.cpp auf Windows und Android (C++ mit SIMD-Optimierung) sowie WhisperKit auf Apple-Plattformen (Swift mit CoreML-Beschleunigung). Beide Implementierungen sind für On-Device-Inferenz optimiert.
Modellgrößen
- Whisper Small: ~250 MB Download, ~500 MB RAM bei Inferenz
- Whisper Medium: ~800 MB Download, ~1.5 GB RAM bei Inferenz
Genauigkeit (WER)
Word Error Rate bei deutschen Diktaten: Small erreicht ~5% WER, Medium ~3% WER. Bei Fachvokabular (Medizin, Recht) verbessert das integrierte Wörterbuch die Ergebnisse zusätzlich.
Latenz
Auf modernen CPUs (Intel i5 ab 2018, Apple M1, Snapdragon 8 Gen 1) liegt die Transkriptionsgeschwindigkeit bei 10-20x Echtzeit. Ein 10-Sekunden-Diktat wird in unter einer Sekunde transkribiert.
Häufig gestellte Fragen
Whisper Diktiersoftware — jetzt sichern
OpenAI Whisper auf deinem Gerät. Lebenslang, auf allen Plattformen — aber nur für die ersten 1.000.