Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Questions frequentas
Whisper Large V3 is a speech-to-text model by OpenAI. STT.ai hosts Whisper Large V3 on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick Whisper Large V3 from the model picker.
@ info
Whisper Large V3 s'exécuta sul nivèl liure de STT.ai — cada visitaire a 600 minutas/mes sens còst. Los plans pagats apondon de limitas mai longas per fichièr, de transcripcions privadas e de files de prioritat.
Whisper Large V3 es publicat jos la licéncia MIT, una licéncia de còde dobèrt permissiva. Podètz auto-ostejar Whisper Large V3 sus vòstre pròpri maquinari o utilizar nòstra version ostejada — ambedos son comercialament utilizables.
Whisper Large V3 pren en carga 99 lengas. La deteccion automatica causís la lenga correcta per la majoritat dels sons; podètz tanben la especificar manualament per una precision melhorada.
Whisper Large V3 traça l'audio a aperaquí 8.0x en temps real sus nòstras GPU. Un fichièr àudio d'una ora se acaba en mens de 7 minutas; los fichièrs mai longs son plaçats en fila e notificats per corrièr electronic quand son acabats.
Whisper Large V3 a de paramètres 1.55B. Los modèls mai grands son mai precises mas mai lents; STT.ai òste Whisper Large V3 sul GPU, doncas lo compte de paramètres afecta pas vòstras performanças del costat client.
Whisper Large V3 accepta totes los formats que pren en carga STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, e d'autres. Sortida coma TXT, SRT, VTT, DOX, JSON, o PDF.
@ info: shell
@ info
Utilizatz l'aisina compare-stt per comparar Whisper Large V3 amb quin autre modèl suportat sul meteis audio — veiretz WER, lo comptatge de segments, las etiquetas dels parlants e las pontuacions de fiabilitat a costat. La comparason Whisper Large V3 vs Whisper Large V3 es la mai comuna.
Òc. Especifiquez "whisper-large-v3" coma paramètre del modèl sul punt de fin /v1/transcribe. Los SDK Python e Node.js incluson d'exemples Whisper Large V3. Lo nivèl API liure inclutz 100 minutas/mes.
Òc. Perque Whisper Large V3 es licenciat amb MIT, podètz l'albergar. La pagina de còde dobèrt de STT.ai lista lo repositori e los pes del projècte. La majoritat de las equipas de produccion utilizan nòstra version albergada per passar l'aquisicion de GPU, los escambis de modèls e las operacions.