Signaler la demande de bogue/caractère

Tracs avec STT.ai Enhanced

Name: STT.ai Enhanced
Author: STT.ai

Fonctionne avec audio et vidéo accessibles au public. Le contenu protégé par DRM n'est pas pris en charge.

Mise à niveau pour amélioration

Transcription privée

Dialogue avec la transcription

Débloquer avec Pro →

Déposer le fichier ici ou cliquer pour parcourir

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — jusqu'à 2 Go

Téléchargement par lots de plusieurs fichiers avec Pro

Mise à niveau pour amélioration

Transcription privée

Dialogue avec la transcription

Débloquer avec Pro →

Mise à niveau pour amélioration

La parole en temps réel au texte. L'IA corrige automatiquement lorsque vous parlez — la précision s'améliore avec la parole plus longue.

Testez d'abord votre microphone

10 min/jour gratuit 600 min sans inscription Pas de carte de crédit Chiffres

Inscrivez-vous gratuitement →

3.2%

WER

100

Langues

160.0x

Vitesse

Proprietary

Licence

À propos STT.ai Enhanced

STT.ai Enhanced est notre modèle le plus précis et le plus rapide de parole-texte. Construit sur une architecture de transformateur de pointe avec des optimisations propriétaires, il offre des taux d'erreur de mots leader dans l'industrie dans plus de 100 langues. Idéal pour la transcription de production, le sous-titrage en temps réel et les applications d'entreprise.

Langues soutenues par STT.ai Enhanced

Anglais

Espagnol

Français

Allemand

Chinois

Japonais

Coréen

Portugais

Arabe

Hindi

Russe

Italien

Néerlandais

Turc

Polonais

Suédois

Indonésien

Thaï

Vietnamien

Tchèque

Grec

Roumain

Hongrois

Hébreu

Danois

Finnois

Norvégien

Ukrainien

Malais

Bengali

✦ Déverrouillage du modèle amélioré

Obtenez l'accès à notre modèle le plus précis avec n'importe quel forfait payant. 3,2% WER, 160x vitesse en temps réel, 100+ langues.

Afficher les plans →

ou inscrivez-vous gratuitement

Modèle Info

FournisseurSTT.ai
Architecture-
LicenceProprietary
Mise à jourMar 2026

Modèles connexes

4.2% WER

5.1% WER

3.5% WER

7.8% WER

3.0% WER

Questions fréquemment posées

STT.ai Enhanced est un modèle speech-to-text par STT.ai. STT.ai héberge STT.ai Enhanced sur notre infrastructure GPU afin que vous puissiez l'utiliser sans fournir votre propre matériel — télécharger audio ou vidéo et choisir STT.ai Enhanced à partir du modèle de sélection.

Sur les repères standard, STT.ai Enhanced atteint environ 3.2% de Word Error Rate. La précision du monde réel dépend de la qualité audio, de l'accent et de la langue; pour les enregistrements bruyants ou accentués, attendez quelques points de pourcentage plus haut WER.

STT.ai Enhanced est un modèle premium — inclus avec n'importe quel forfait STT.ai payé à partir de 5 $/mois. Les utilisateurs gratuits peuvent prévisualiser STT.ai Enhanced sur des clips courts; les fichiers plus longs nécessitent un forfait actif.

STT.ai Enhanced est distribué sous Proprietary. La version hébergée de STT.ai gère la conformité de licence pour vous afin que l'utilisation commerciale par notre service est simple.

STT.ai Enhanced prend en charge 100 langues. La détection automatique choisit la bonne langue pour la plupart des audio; vous pouvez également le spécifier manuellement pour un petit ascenseur de précision.

STT.ai Enhanced traite l'audio à environ 160.0x en temps réel sur nos GPUs. Un fichier audio d'une heure se termine en moins de 1 minutes; des fichiers plus longs font la file d'attente et les avisent par courrier électronique lorsque cela est fait.

STT.ai Enhanced a 1.5B paramètres. Les modèles plus grands ont tendance à être plus précis mais plus lents; STT.ai hôtes STT.ai Enhanced sur GPU de sorte que le nombre de paramètres n'affecte pas les performances de votre client.

STT.ai Enhanced accepte chaque format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, et autres. Sortie comme TXT, SRT, VTT, DOCX, JSON ou PDF.

Oui. La diarisation des haut-parleurs se déroule aux côtés de STT.ai Enhanced pour chaque transcription — chaque haut-parleur est étiqueté et vous pouvez les renommer dans l'éditeur par la suite.

Oui. STT.ai Enhanced fonctionne dans notre infrastructure privée — audio est traité et supprimé par défaut. Pro+ ajoute le cryptage côté client afin que les transcriptions soient illisibles sans votre clé, et Private Cloud vous permet d'auto-héberger STT.ai Enhanced entièrement dans votre propre VPC.

Utilisez l'outil compare-stt pour exécuter STT.ai Enhanced contre n'importe quel autre modèle pris en charge sur le même son — vous verrez WER, le nombre de segments, les étiquettes des haut-parleurs et les scores de confiance côte à côte. La comparaison STT.ai Enhanced vs Whisper Large V3 est la plus courante.

Oui. Spécifiez "stt-ai-enhanced" comme paramètre de modèle sur le paramètre /v1/transcrire. Les SDKs Python et Node.js incluent STT.ai Enhanced exemples. Le niveau d'API gratuit comprend 100 minutes/mois.

La licence pour STT.ai Enhanced est définie par STT.ai; l'auto-hébergement dépend de leurs conditions. Le service hébergé de STT.ai fonctionne STT.ai Enhanced sur GPU géré afin que vous n'ayez pas besoin de gérer cette intégration.

Tracs avec STT.ai Enhanced

À propos STT.ai Enhanced

Langues soutenues par STT.ai Enhanced

✦ Déverrouillage du modèle amélioré

Modèle Info

Modèles connexes

Questions fréquemment posées

Qu'est-ce que STT.ai Enhanced?

Quelle est la précision de STT.ai Enhanced?

STT.ai Enhanced est-il libre d'utilisation?

Quelle licence STT.ai Enhanced utilise-t-elle?

Combien de langues STT.ai Enhanced supporte-t-il?

À quelle vitesse est STT.ai Enhanced?

Quelle est la taille du modèle STT.ai Enhanced?

Quels formats audio peuvent transcrire STT.ai Enhanced?

Est-ce que STT.ai Enhanced détecte plusieurs haut-parleurs?

Mes données sont-elles privées lors de l'utilisation de STT.ai Enhanced?

Comment STT.ai Enhanced se compare-t-il à d'autres modèles STT?

Puis-je utiliser STT.ai Enhanced via l'API?

Puis-je lancer STT.ai Enhanced sur mon propre serveur?