Änderungsprotokoll
Alle Updates, Funktionen und Verbesserungen für Transkript
Version 3.0
Dezember 2025
Sprechererkennung
Sprachmemos teilen
100% Apple Intelligence
Was ist neu
- Sprechererkennung (Diarisierung): Automatische Erkennung verschiedener Sprecher in Ihren Aufnahmen. Perfekt für Meetings, Interviews und Podcasts. Farbcodierte Labels zeigen, wer was gesagt hat.
- Sprachmemos-Integration: Teilen Sie Aufnahmen direkt aus Apples Sprachmemos-App über das Teilen-Menü an Transkript.
- FluidAudio Engine: Neue On-Device Sprecherdiarisierung powered by FluidAudio SDK für präzise Sprecheridentifikation.
- Sprecher-Voreinstellungen: Wählen Sie zwischen Interview (2-3 Sprecher), Meeting (4-6 Sprecher), Gespräch (2 Sprecher) oder benutzerdefinierten Einstellungen.
Architektur-Änderungen
- Whisper durch FluidAudio ersetzt: Whisper wurde durch das FluidAudio SDK ersetzt, das sowohl Spracherkennung (25 europäische Sprachen) als auch Sprechererkennung bietet. Apple Intelligence bleibt für reine Transkriptions-Workflows verfügbar.
- Nur iOS 26+: Erfordert iOS 26.1 oder höher mit aktivierter Apple Intelligence.
- Share Extension: Neue Share Extension ermöglicht das Empfangen von Audiodateien aus jeder App über das Teilen-Menü.
Version 2.6
Dezember 2025
Word-Export
Lange Texte
Was ist neu
- DOCX/Word-Export: Exportieren Sie Ihre Zusammenfassungen als Microsoft Word-Dokumente (.docx) zusätzlich zu PDF. Perfekt zum Bearbeiten und Teilen.
- Hierarchische Zusammenfassung: Lange Transkripte werden jetzt automatisch in Abschnitte aufgeteilt, einzeln zusammengefasst und dann zu einer finalen Zusammenfassung kombiniert. Kein Hängenbleiben bei sehr langen Texten mehr.
Verbesserungen
- Genauer Fortschritt: Fortschrittsanzeige basiert jetzt auf der tatsächlichen Audio-Position statt der Textlänge.
- Bessere Zeitschätzungen: Zeigt geschätzte Restzeit während der Transkription an.
- Plattformübergreifende ZIP-Implementierung für zuverlässige DOCX-Erstellung
Version 2.5
Dezember 2025
Vereinfachte UI
Auto Engine-Auswahl
Was ist neu
- Automatische Engine-Auswahl: Die App wählt jetzt automatisch die beste KI-Engine (Apple Intelligence oder Whisper) basierend auf der ausgewählten Sprache.
- Vereinfachte Sprachauswahl: Sehen Sie den Verfügbarkeitsstatus für jede Sprache mit grünem Blitz (Apple Intelligence) oder orangem Häkchen (Whisper).
- Ein-Klick Whisper-Download: Einfache Aufforderung zum Download des Whisper-Modells für 90+ zusätzliche Sprachen.
- Optimierte Einstellungen: Manuelle Engine-Auswahl entfernt für eine übersichtlichere, intuitivere Oberfläche.
Verbesserungen
- Dynamische Sprachlisten-Aktualisierung wenn Whisper-Modelle heruntergeladen werden
- Bessere visuelle Indikatoren für Engine-Verfügbarkeit
- Verbessertes Erstnutzer-Erlebnis
Version 2.0
Dezember 2025
Whisper KI
Untertitel-Optimierung
Video-Player
Neue Funktionen
- Whisper KI Integration: OpenAIs Whisper als alternative Transkriptions-Engine mit Unterstützung für 99 Sprachen und hoher Genauigkeit.
- Dual-Engine-Auswahl: Wechseln Sie zwischen Apple Intelligence (Live-Transkription) und Whisper (Batch-Verarbeitung) auf dem Hauptbildschirm.
- Untertitel-Optimierung: Automatisches Aufteilen langer Segmente in lesbare Untertitel mit anpassbarer max. Zeichenzahl, Dauer und Timing.
- Originaltext anzeigen: Zeigen Sie den Originaltext bei unvollständig übersetzten Segmenten an, um den Kontext zu verstehen.
- Whisper-Verarbeitungsanimation: Schöne animierte Wellenform-Anzeige während Whisper Audio verarbeitet.
Verbesserungen
- Schnellstart: Option zum automatischen Starten der Transkription beim Ablegen einer Datei (in den Einstellungen konfigurierbar).
- Animierter Fortschritt: Kontinuierlich animierter Fortschrittsring und Wellenform-Symbol während der Transkription für besseres visuelles Feedback.
- App-Kopfzeile: Neue Kopfzeile mit App-Symbol, Name und Menü für schnellen Zugriff auf Einstellungen und Über.
- Button-Beschriftungen: Alle Aktions-Buttons zeigen jetzt Textbeschriftungen für bessere Übersichtlichkeit und Bedienbarkeit.
- Vollbild-Export: Export-Dialoge nutzen jetzt den Vollbildmodus für bessere Übersicht der Optionen.
- Video-Player-Steuerung: Wiedergabegeschwindigkeit (0,5x-2x), AirPlay, Video-Füllung und natives macOS-Vollbild.
- Audio-Player-Geschwindigkeit: Variable Wiedergabegeschwindigkeit für die Audio-Vorschau (0,5x bis 2x).
- Verbesserte Übersetzungsansicht: Vorschau-Button in die Aktionsleiste verschoben, konsistent mit der Transkript-Ansicht.
- Intelligente Live-Vorschau: Live-Transkriptions-Vorschau nur bei Apple Intelligence angezeigt (nicht bei Whisper).
Whisper-Sprachen
- 99 Sprachen: Afrikaans, Albanisch, Amharisch, Arabisch, Armenisch, Aserbaidschanisch, Baskisch, Weißrussisch, Bengali, Bosnisch, Bulgarisch, Birmanisch, Katalanisch, Chinesisch, Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Estnisch, Finnisch, Französisch, Galizisch, Georgisch, Deutsch, Griechisch, Gujarati, Hebräisch, Hindi, Ungarisch, Isländisch, Indonesisch, Italienisch, Japanisch, Kannada, Kasachisch, Khmer, Koreanisch, Laotisch, Lettisch, Litauisch, Mazedonisch, Malaiisch, Malayalam, Maltesisch, Maori, Marathi, Mongolisch, Nepali, Norwegisch, Paschtu, Persisch, Polnisch, Portugiesisch, Punjabi, Rumänisch, Russisch, Serbisch, Singhalesisch, Slowakisch, Slowenisch, Somali, Spanisch, Swahili, Schwedisch, Tagalog, Tamil, Tatarisch, Telugu, Thai, Tibetisch, Türkisch, Turkmenisch, Ukrainisch, Urdu, Usbekisch, Vietnamesisch, Walisisch, Jiddisch, Yoruba und mehr.
Version 1.1
Dezember 2025
Video-Support
VTT Export
Untertitel-Vorschau
Neue Funktionen
- Video zu Untertiteln: Laden Sie MP4-, MOV- oder M4V-Videodateien direkt. Audio wird automatisch für die Transkription extrahiert.
- WebVTT Export: Neues VTT-Format für Web-Videoplayer neben der bestehenden SRT-Unterstützung.
- Video-Vorschaubild: Sehen Sie ein Vorschaubild Ihres Videos in der Dateiinfo-Karte.
- Untertitel-Synchronisations-Vorschau: Vorschau Ihrer Untertitel über dem Original-Video zur Überprüfung des Timings vor dem Export.
- Mehrsprachige Untertitel: Erstellen Sie Untertitel in der Originalsprache UND übersetzte Versionen in 34 Sprachen.
Verbesserungen
- Verbesserte Dateityp-Erkennung für Videoformate
- Visuelle Unterscheidung zwischen Audio- und Videodateien in der Benutzeroberfläche
- Verbesserter Export-Dialog mit formatspezifischen Hinweisen
Version 1.0
November 2025
Erstveröffentlichung
Kernfunktionen
- Audio-Transkription: Unterstützung für MP3, M4A, WAV, AAC, AIFF und CAF-Dateien mit Wort-genauen Zeitstempeln.
- Live-Aufnahme: Nehmen Sie Audio direkt in der App mit Echtzeit-Transkriptions-Vorschau auf.
- KI-Zusammenfassungen: Generieren Sie intelligente Zusammenfassungen mit Apple Intelligence in mehreren Sprachen.
- Übersetzung: Übersetzen Sie Transkripte in 34 Sprachen bei Beibehaltung der Zeitstempel für Untertitel-Export.
- Mehrere Exportformate: TXT, SRT-Untertitel, JSON und PDF mit formatierten Zusammenfassungen.
- Bibliotheksverwaltung: Speichern, organisieren und durchsuchen Sie Ihre Transkriptionen mit iCloud-Sync.
- Siri & Kurzbefehle: Sprachbefehle und Automatisierung über die Kurzbefehle-App.
- Kontrollzentrum-Widgets: Schnellstart-Buttons für das iOS-Kontrollzentrum.
- Live-Aktivitäten: Echtzeit-Fortschritt auf dem Sperrbildschirm und Dynamic Island.
- Audio-Vorschau-Player: Hören Sie Audiodateien vor der Transkription mit Wiedergabesteuerung.
- 100% Privatsphäre: Alle Verarbeitung auf dem Gerät mit Apple Intelligence. Keine Cloud-Uploads.
Unterstützte Sprachen
- Transkription: Englisch, Deutsch, Französisch, Spanisch, Italienisch, Niederländisch, Portugiesisch, Japanisch, Koreanisch, Chinesisch und mehr
- Übersetzung: 34 Zielsprachen inkl. Arabisch, Hebräisch, Thai, Vietnamesisch, Indonesisch, Türkisch, Griechisch, Russisch, Ukrainisch
- UI-Sprachen: Englisch, Deutsch, Französisch, Niederländisch