Transcribe with NVIDIA Canary

Funciona amb de fichièrs àudio e vidèo publics. Lo contengut protegit per DRM es pas suportat.

@ info: status
Private transcript
Discutir amb transcripcion
Desverrollar amb Pro →
@ info: status
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - fins a 2 Go
@ info: status
Private transcript
Discutir amb transcripcion
Desverrollar amb Pro →
@ info: status
Enregistrament: 0:00
Temps real Cira (imediata)
Enriquit Whisper (precis)
Public links: 24h, text only · Enregistrar for 7d + audio · Pro for private links

Transformar la votz en tèxt en temps real. L'IA se corrigís automaticament mentre que parlatz - la precision melhora amb la durada de la votz.

Testatz lo vòstre microfòn en primièr
❤️ Ador STT.ai ? Ditz-lo als vòstres amics !
Avètz utilizat vòstras transcripcions liuras

Inscriu-te per recebre 600 minutas/mes, o per obtenir de transcripcions illimitadas.

10 minutas liuras/ jorn 600 min gratuit amb inscripcion Pas cap de carta de credit EncriptatComment
Inscriure' s →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Questions frequentas

NVIDIA Canary is a speech-to-text model by NVIDIA. STT.ai hosts NVIDIA Canary on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick NVIDIA Canary from the model picker.

@ info

NVIDIA Canary s'exécuta sul nivèl liure de STT.ai — cada visitaire a 600 minutas/mes sens còst. Los plans pagats apondon de limitas mai longas per fichièr, de transcripcions privadas e de files de prioritat.

NVIDIA Canary es publicat jos la licéncia CC-BY-4.0, una licéncia de còde dobèrt permissiva. Podètz auto-ostejar NVIDIA Canary sus vòstre pròpri maquinari o utilizar nòstra version ostejada — ambedos son comercialament utilizables.

NVIDIA Canary pren en carga 4 lengas. La deteccion automatica causís la lenga correcta per la majoritat dels sons; podètz tanben la especificar manualament per una precision melhorada.

NVIDIA Canary traça l'audio a aperaquí 45.0x en temps real sus nòstras GPU. Un fichièr àudio d'una ora se acaba en mens de 1 minutas; los fichièrs mai longs son plaçats en fila e notificats per corrièr electronic quand son acabats.

NVIDIA Canary a de paramètres 1B. Los modèls mai grands son mai precises mas mai lents; STT.ai òste NVIDIA Canary sul GPU, doncas lo compte de paramètres afecta pas vòstras performanças del costat client.

NVIDIA Canary accepta totes los formats que pren en carga STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, e d'autres. Sortida coma TXT, SRT, VTT, DOX, JSON, o PDF.

@ info: shell

@ info

Utilizatz l'aisina compare-stt per comparar NVIDIA Canary amb quin autre modèl suportat sul meteis audio — veiretz WER, lo comptatge de segments, las etiquetas dels parlants e las pontuacions de fiabilitat a costat. La comparason NVIDIA Canary vs Whisper Large V3 es la mai comuna.

Òc. Especifiquez "nvidia-canary" coma paramètre del modèl sul punt de fin /v1/transcribe. Los SDK Python e Node.js incluson d'exemples NVIDIA Canary. Lo nivèl API liure inclutz 100 minutas/mes.

Òc. Perque NVIDIA Canary es licenciat amb CC-BY-4.0, podètz l'albergar. La pagina de còde dobèrt de STT.ai lista lo repositori e los pes del projècte. La majoritat de las equipas de produccion utilizan nòstra version albergada per passar l'aquisicion de GPU, los escambis de modèls e las operacions.