Transcribe with NVIDIA Parakeet
3.0%
WER
1
Languages
55.0x
Speed
CC-BY-4.0
License
About NVIDIA Parakeet
Languages Supported by NVIDIA Parakeet
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Często zadawane pytania
NVIDIA Parakeet jest modelem mowy do tekstu przez NVIDIA. STT.ai hosts NVIDIA Parakeet na naszej infrastrukturze GPU, dzięki czemu można go wykorzystać bez dostarczania własnego sprzętu – wyślij audio lub wideo i wybierz NVIDIA Parakeet z wybieracza modeli.
W odniesieniu do standardowych poziomów odniesienia NVIDIA Parakeet osiąga około 3.0% Błędów Word. Dokładność rzeczywistego świata zależy od jakości dźwięku, akcentu i języka; w przypadku głośnych lub akcentowanych nagrań, oczekuje się kilku punktów procentowych wyższych WER.
NVIDIA Parakeet biegnie na wolnym poziomie STT.ai – każdy odwiedzający otrzymuje 600 minut/miesiąc bez kosztu. Płacone plany dodają dłużej limity na pliki, prywatne transkrypty i priorytetowe kolejki.
NVIDIA Parakeet jest wydane pod CC-BY-4.0, licencja otwartego źródła. Można samodzielnie gospodarować NVIDIA Parakeet na własnym sprzętie lub korzystać z naszej hospodowanej wersji – obie są komercyjne użyteczne.
NVIDIA Parakeet obsługuje 1 języków. Automatyczne wykrywanie wybiera właściwy język dla większości audio; można również wskazywać go ręcznie dla małego podnoszenia dokładności.
NVIDIA Parakeet procesów audio w około 55.0x w czasie rzeczywistym na naszych GPU. 1-godzinny plik audio zakończy się w mniej niż 8802 minut; dłuższa kolejka plików i powiadomić za pośrednictwem e-maila.
NVIDIA Parakeet ma 8802 parametrów. Większe modele są zazwyczaj bardziej dokładne, ale wolniej; STT.ai hostów NVIDIA Parakeet w GPU, tak aby liczba parametrów nie wpływała na wydajność klienta.
NVIDIA Parakeet akceptuje każdy format obsługi STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i inne. Wynik jako TXT, SRT, VTT, DOCX, JSON lub PDF.
Tak. Dializacja głośnika biegnie obok NVIDIA Parakeet dla każdej transkrypcji — każdy głośnik jest oznaczony i można je później zmienić w edytorze.
Tak. NVIDIA Parakeet uruchamia w naszym zarządzanym środowisku – audio jest przetwarzany i usuwany domyślnie i nigdy nie używany do szkolenia bez wyraźnego opt-in. Pro plany dodają klient-side szyfrowanie do transkrypcji w pokoju.
Użyj narzędzia porównania-stt, aby uruchomić NVIDIA Parakeet w stosunku do jakiegokolwiek innego modelu obsługiwanego w tym samym audio – zobaczysz WER, liczbę segmentów, etykiety głośnika i wyniki ufności po stronie. Porównanie NVIDIA Parakeet ws Whisper Large V3 jest najczęściej uruchomione.
Tak. Określić "nvidia-parakeet" jako parametr modelu w końcowym punktie końcowym /v1/transcribe. Python i Node.js SDKs zawierają NVIDIA Parakeet przykładów. Darmowy poziom API obejmuje 100 minut/miesiąc.
Tak. Ponieważ NVIDIA Parakeet jest 8802-licenzowany, możesz go sam-host. STT.ai stron otwartego źródła wykazuje repo i wagi projektu. Większość zespołów produkcyjnych korzysta z naszej hosted wersji, aby pominąć zamówienia GPU, modele swaps i ops.