Transcrire avec NVIDIA Parakeet

Fonctionne avec audio et vidéo accessibles au public. Le contenu protégé par DRM n'est pas pris en charge.

Mise à niveau pour amélioration
Private transcript
Dialogue avec la transcription
Débloquer avec Pro →
Déposer le fichier ici ou cliquer pour parcourir
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — jusqu'à 2 Go
Mise à niveau pour amélioration
Private transcript
Dialogue avec la transcription
Débloquer avec Pro →
Mise à niveau pour amélioration
Enregistrement : 0:00
Temps réel Vosk (instantanément)
Amélioration Whisper (préciser)
Liens publics: 24h, texte seulement · Inscrivez-vous pour 7d + audio · Pour pour les liaisons privées

La parole en temps réel au texte. L'IA corrige automatiquement lorsque vous parlez — la précision s'améliore avec la parole plus longue.

Testez d'abord votre microphone
❤️ Aimez STT.ai? Dites à vos amis!
Vous avez utilisé vos transcriptions gratuites

Inscrivez-vous gratuitement pour obtenir 600 minutes/mois, ou mise à jour pour des transcriptions illimitées.

10 min/jour gratuit 600 min sans inscription Pas de carte de crédit Chiffres
Inscrivez-vous gratuitement →
3.0%
WER
1
Languages
55.0x
Speed
CC-BY-4.0
License

À propos de NVIDIA Parakeet

NVIDIA Parakeet TDT 1.1B is a state-of-the-art English ASR model using FastConformer architecture with Token-and-Duration Transducer (TDT). It achieves near-human accuracy on standard English benchmarks and is highly optimized for NVIDIA GPUs.

Langues prises en charge par NVIDIA Parakeet

Questions fréquemment posées

NVIDIA Parakeet est un modèle speech-to-text par NVIDIA. STT.ai héberge NVIDIA Parakeet sur notre infrastructure GPU afin que vous puissiez l'utiliser sans fournir votre propre matériel — télécharger audio ou vidéo et choisir NVIDIA Parakeet à partir du modèle de sélection.

Sur les repères standard, NVIDIA Parakeet atteint environ 3.0% de Word Error Rate. La précision du monde réel dépend de la qualité audio, de l'accent et de la langue; pour les enregistrements bruyants ou accentués, attendez quelques points de pourcentage plus haut WER.

NVIDIA Parakeet fonctionne sur le niveau gratuit de STT.ai — chaque visiteur obtient 600 minutes/mois sans frais. Les plans payants ajoutent plus de limites par fichier, des transcriptions privées et la file d'attente prioritaire.

NVIDIA Parakeet est publié sous CC-BY-4.0, une licence open-source permissive. Vous pouvez vous-même héberger NVIDIA Parakeet sur votre propre matériel ou utiliser notre version hébergée — les deux sont utilisables commercialement.

NVIDIA Parakeet prend en charge 1 langues. La détection automatique choisit la bonne langue pour la plupart des audio; vous pouvez également le spécifier manuellement pour un petit ascenseur de précision.

NVIDIA Parakeet traite l'audio à environ 55.0x en temps réel sur nos GPUs. Un fichier audio d'une heure se termine en moins de 1 minutes; des fichiers plus longs font la file d'attente et les avisent par courrier électronique lorsque cela est fait.

NVIDIA Parakeet a 1.1B paramètres. Les modèles plus grands ont tendance à être plus précis mais plus lents; STT.ai hôtes NVIDIA Parakeet sur GPU de sorte que le nombre de paramètres n'affecte pas les performances de votre client.

NVIDIA Parakeet accepte chaque format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, et autres. Sortie comme TXT, SRT, VTT, DOCX, JSON ou PDF.

Oui. La diarisation des haut-parleurs se déroule aux côtés de NVIDIA Parakeet pour chaque transcription — chaque haut-parleur est étiqueté et vous pouvez les renommer dans l'éditeur par la suite.

Oui. NVIDIA Parakeet fonctionne dans notre environnement géré — l'audio est traité et supprimé par défaut et jamais utilisé pour la formation sans opt-in explicite.

Utilisez l'outil compare-stt pour exécuter NVIDIA Parakeet contre n'importe quel autre modèle pris en charge sur le même son — vous verrez WER, le nombre de segments, les étiquettes des haut-parleurs et les scores de confiance côte à côte. La comparaison NVIDIA Parakeet vs Whisper Large V3 est la plus courante.

Oui. Spécifiez "nvidia-parakeet" comme paramètre de modèle sur le paramètre /v1/transcrire. Les SDKs Python et Node.js incluent NVIDIA Parakeet exemples. Le niveau d'API gratuit comprend 100 minutes/mois.

Oui. Parce que NVIDIA Parakeet est CC-BY-4.0-licenced, vous pouvez auto-héberger. STT.ai's open-source page liste la prise en charge du projet et les poids. La plupart des équipes de production utilisent notre version hébergée pour sauter l'approvisionnement GPU, les swaps de modèles, et les ops.