Nowe funkcje transkrypcji mowy na tekst w systemach Apple – szybciej niż Whisper

imagazine.pl 5 godzin temu

W najnowszych wersjach deweloperskich iOS 26 i macOS Tahoe, Apple udostępniło nowe narzędzia do transkrypcji mowy – SpeechAnalyzer i SpeechTranscriber – które zaskakują szybkością i dokładnością.

Test przeprowadzony przez MacStories pokazał, iż nowa technologia Apple dorównuje dokładnością znanemu modelowi Whisper od OpenAI (używanemu m.in. w MacWhisper i VidCap), ale działa ponad dwukrotnie szybciej. Przykład: 34-minutowy film został przetworzony w zaledwie 45 sekund przez autorskie narzędzie „Yap” oparte na frameworku Apple, podczas gdy MacWhisper potrzebował 1:41 min.

Aplikacja Czas przygotowania transkrypcji
Yap (framework Apple ) 0:45
MacWhisper (Large V3 Turbo) 1:41
VidCap 1:55
MacWhisper (Large V2) 3:55

Apple udostępnia te narzędzia deweloperom do integracji w aplikacjach — można je wykorzystać zarówno do dyktowania, jak i do rozpoznawania poleceń głosowych lub transkrypcji materiałów wideo/audio.

To istotna zmiana szczególnie dla osób regularnie pracujących z transkrypcjami, np. studentów, dziennikarzy czy twórców wideo.

Jeśli artykuł Nowe funkcje transkrypcji mowy na tekst w systemach Apple – szybciej niż Whisper nie wygląda prawidłowo w Twoim czytniku RSS, to zobacz go na iMagazine.

Idź do oryginalnego materiału