Transcribe with NVIDIA Parakeet

Funciona amb el & vídeo d' àudio públic & disponible. El contingut de DRM no està implementat.

Actualització per millorar
Private transcript
Xat amb transcripció
Desbloqueja amb Pro →
Deixeu anar el fitxer aquí o cliqueu per a navegar
MP3, WAV, M4A, FLAC, MP4, MKV, MV, MOV, WebM KDE fins a 2GB
Actualització per millorar
Private transcript
Xat amb transcripció
Desbloqueja amb Pro →
Actualització per millorar
Gravació: 0:00
Temps real Vosk (instant) russia_ subjects. kgm
Millorada Rumuz (acrati)
Enllaços públics: 24h, només text · Signa per a 7d + àudio · Pro per a enllaços privats

El discurs en temps real al text. Els errors de l' IA tal i com esteu parlant milloren les precisiós amb el discurs més llarg.

Primer prova el micròfon
❤️ Love STT.ai? Tell your friends!
Has utilitzat les teves transcripcions lliures

Signa't per obtenir 600 minuts/ mesos, o actualització de les transcripcions il·limitats.

10 dies lliures 600 mins de franc amb senyal Sense targeta de crèdit Xifrat
Compareu- vos lliurement →
3.0%
WER
1
Languages
55.0x
Speed
CC-BY-4.0
License

About NVIDIA Parakeet

Languages Supported by NVIDIA Parakeet

Preguntes més freqüents

NVIDIA Parakeet is a speech-to-text model by NVIDIA. STT.ai hosts NVIDIA Parakeet on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick NVIDIA Parakeet from the model picker.

Sobre punts de referència estàndard, 8800 s' aconsegueix al voltant de 881% d' error de paraula. La precisió real del món depèn de la qualitat de l' àudio, de l' accent i del llenguatge; per a enregistraments amb soroll o amb accent, espereu uns quants percentatges més alts WER.

NVIDIA Parakeet runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.

8800 s' allibera sota 881, una llicència de codi obert permissiva. Podeu fer d' autonom 88 000 en el vostre propi maquinari o fer servir la nostra versió allotjada, així com es poden utilitzar comercialment.

8800 dóna les llengües 8800. Auto- detecta l' idioma correcte per a la majoria d' àudio; també ho podeu especificar manualment per a un petit augment de precisió.

88 000 processos d' àudio a sobre de 8800x en temps real a les nostres GPUs. Un fitxer d' àudio d' 1 hora acaba en 1 minuts; cua de fitxers més llarga i notificaràs per correu electrònic quan s' hagi fet.

NVIDIA Parakeet has 1.1B parameters. Larger models tend to be more accurate but slower; STT.ai hosts NVIDIA Parakeet on GPU so the parameter count doesn't affect your client-side performance.

NVIDIA Parakeet accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.

Sí. El President diarització s' executa al costat de 88 000 per a cada recripció s' etiqueta per a cada altaveu i després els podreu reanomenar a l' editor.

Sí. 8800 s' executa en el nostre entorn gestionat l' àudio i s' elimina per omissió i mai s' usa per a l' entrenament sense opt- in explícita. Els plans poden afegir xifrats al client per a les transcripcions a la resta.

Useu l' eina Compara- t per executar 88 000 contra qualsevol altre model acceptat en el mateix àudio, podeu veure WE, nombre de segments, etiquetes d' altaveu, i puntuacions de confiança a costat. La comparació 88 000 contra els Rumors V3 és la més comuna.

Sí. Especifiqueu "nvidia-parakeet0" com a paràmetre del model en el punt d' acabament / v1/trancrib. Python i Node. js SDKs inclouen 881 exemples. L' API lliure inclou 100 minuts/ mesos.

Yes. Because NVIDIA Parakeet is CC-BY-4.0-licensed, you can self-host it. STT.ai's open-source page lists the project repo and weights. Most production teams use our hosted version to skip GPU procurement, model swaps, and ops.