Signaler la demande de bogue/caractère

Tracs avec Whisper Large V3

Name: Whisper Large V3
Author: OpenAI

Fonctionne avec audio et vidéo accessibles au public. Le contenu protégé par DRM n'est pas pris en charge.

Mise à niveau pour amélioration

Transcription privée

Dialogue avec la transcription

Débloquer avec Pro →

Déposer le fichier ici ou cliquer pour parcourir

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — jusqu'à 2 Go

Téléchargement par lots de plusieurs fichiers avec Pro

Mise à niveau pour amélioration

Transcription privée

Dialogue avec la transcription

Débloquer avec Pro →

Mise à niveau pour amélioration

La parole en temps réel au texte. L'IA corrige automatiquement lorsque vous parlez — la précision s'améliore avec la parole plus longue.

Testez d'abord votre microphone

10 min/jour gratuit 600 min sans inscription Pas de carte de crédit Chiffres

Inscrivez-vous gratuitement →

4.2%

WER

Langues

8.0x

Vitesse

MIT

Licence

À propos Whisper Large V3

Whisper Large V3 est le modèle phare de reconnaissance vocale open-source d'OpenAI. Avec 1,55 milliard de paramètres, il offre une précision exceptionnelle dans 99 langues. Il utilise une architecture d'encodeur-décodeur de transformateur formé sur 680.000 heures de données audio multilingues.

Langues soutenues par Whisper Large V3

Anglais

Espagnol

Français

Allemand

Chinois

Japonais

Coréen

Portugais

Arabe

Hindi

Russe

Italien

Néerlandais

Turc

Polonais

Suédois

Indonésien

Thaï

Vietnamien

Tchèque

Grec

Roumain

Hongrois

Hébreu

Danois

Finnois

Norvégien

Ukrainien

Malais

Bengali

Modèle Info

FournisseurOpenAI
Architecture-
LicenceMIT
Mise à jourMar 2026

Modèles connexes

3.2% WER

5.1% WER

3.5% WER

7.8% WER

3.0% WER

Questions fréquemment posées

Whisper Large V3 est un modèle speech-to-text par OpenAI. STT.ai héberge Whisper Large V3 sur notre infrastructure GPU afin que vous puissiez l'utiliser sans fournir votre propre matériel — télécharger audio ou vidéo et choisir Whisper Large V3 à partir du modèle de sélection.

Sur les repères standard, Whisper Large V3 atteint environ 4.2% de Word Error Rate. La précision du monde réel dépend de la qualité audio, de l'accent et de la langue; pour les enregistrements bruyants ou accentués, attendez quelques points de pourcentage plus haut WER.

Whisper Large V3 fonctionne sur le niveau gratuit de STT.ai — chaque visiteur obtient 600 minutes pour commencer sans frais. Les plans payés ajoutent des limites plus longues par fichier, des transcriptions privées et la file d'attente prioritaire.

Whisper Large V3 est publié sous MIT, une licence open-source permissive. Vous pouvez vous-même héberger Whisper Large V3 sur votre propre matériel ou utiliser notre version hébergée — les deux sont utilisables commercialement.

Whisper Large V3 prend en charge 99 langues. La détection automatique choisit la bonne langue pour la plupart des audio; vous pouvez également le spécifier manuellement pour un petit ascenseur de précision.

Whisper Large V3 traite l'audio à environ 8.0x en temps réel sur nos GPUs. Un fichier audio d'une heure se termine en moins de 7 minutes; des fichiers plus longs font la file d'attente et les avisent par courrier électronique lorsque cela est fait.

Whisper Large V3 a 1.55B paramètres. Les modèles plus grands ont tendance à être plus précis mais plus lents; STT.ai hôtes Whisper Large V3 sur GPU de sorte que le nombre de paramètres n'affecte pas les performances de votre client.

Whisper Large V3 accepte chaque format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, et autres. Sortie comme TXT, SRT, VTT, DOCX, JSON ou PDF.

Oui. La diarisation des haut-parleurs se déroule aux côtés de Whisper Large V3 pour chaque transcription — chaque haut-parleur est étiqueté et vous pouvez les renommer dans l'éditeur par la suite.

Oui. Whisper Large V3 fonctionne dans notre environnement géré — l'audio est traité et supprimé par défaut et jamais utilisé pour la formation sans opt-in explicite.

Utilisez l'outil compare-stt pour exécuter Whisper Large V3 contre n'importe quel autre modèle pris en charge sur le même son — vous verrez WER, le nombre de segments, les étiquettes des haut-parleurs et les scores de confiance côte à côte. La comparaison Whisper Large V3 vs Whisper Large V3 est la plus courante.

Oui. Spécifiez "whisper-large-v3" comme paramètre de modèle sur le paramètre /v1/transcrire. Les SDKs Python et Node.js incluent Whisper Large V3 exemples. Le niveau d'API gratuit comprend 100 minutes/mois.

Oui. Parce que Whisper Large V3 est MIT-licenced, vous pouvez auto-héberger. STT.ai's open-source page liste la prise en charge du projet et les poids. La plupart des équipes de production utilisent notre version hébergée pour sauter l'approvisionnement GPU, les swaps de modèles, et les ops.

Tracs avec Whisper Large V3

À propos Whisper Large V3

Langues soutenues par Whisper Large V3

Modèle Info

Modèles connexes

Questions fréquemment posées

Qu'est-ce que Whisper Large V3?

Quelle est la précision de Whisper Large V3?

Whisper Large V3 est-il libre d'utilisation?

Quelle licence Whisper Large V3 utilise-t-elle?

Combien de langues Whisper Large V3 supporte-t-il?

À quelle vitesse est Whisper Large V3?

Quelle est la taille du modèle Whisper Large V3?

Quels formats audio peuvent transcrire Whisper Large V3?

Est-ce que Whisper Large V3 détecte plusieurs haut-parleurs?

Mes données sont-elles privées lors de l'utilisation de Whisper Large V3?

Comment Whisper Large V3 se compare-t-il à d'autres modèles STT?

Puis-je utiliser Whisper Large V3 via l'API?

Puis-je lancer Whisper Large V3 sur mon propre serveur?