Transcribe with NVIDIA Canary

Virkar við almennum tilfari til ljóð og video. DRM-verjað innihald er ikki stuðlað.

Uppgradering til Enhanced
Private transcript
Spæla við transkriptión
Unlock with Pro →
Slepp eina fil her ella trýst fyri at leita
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — upp til 2GB
Uppgradering til Enhanced
Private transcript
Spæla við transkriptión
Unlock with Pro →
Uppgradering til Enhanced
Upptøka: 0:00
Real-time Wax (instant)
Enhanced Skúli (átrúnaður)
24. grein: Tjóðveldi. · Sign up for 7d + audio · Pro for private links

Tala til tekst í sanntíð. AI loysir feilir sjálvvirkandi, tá tú talar - nákvæmnin verður betri við longri talu.

Test mikrofonina fyrst
❤️ Love STT.ai? Tell your friends!
You've used your free transcriptions

600.000 fólk hava fingið boð um at sleppa at velja, og 600.000 hava fingið boð um at sleppa at velja.

10 free min/day 600 f.Kr. - 600 f.Kr. - 600 f.Kr. Kreditkort Kryptað
Sign up free →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Ofta settir spurningar

NVIDIA Canary er ein tal-til-tekst-modell frá NVIDIA. STT.ai er hýsa fyri NVIDIA Canary á okkara GPU-infrakervi, so tú kanst brúka tað uttan at gera títt egna hardware tilfar - senda inn ljóð ella video og vel NVIDIA Canary frá model-veljaranum.

NVIDIA Canary hevur eina orðfeilstíð uppá umleið 3.5% í standard próvtøkum. Real-world accuracy depends on audio quality, accent, and language; for noisy or accented recordings, expect a few percentage points higher WER.

NVIDIA Canary koyrir á STT.ai1's free tier - hvør vitjandi fær 600 minuttir / mánaða uttan kostnað. gjaldandi ætlanirnar leggja longri per-file markið, private transcripts, og priority queuing.

NVIDIA Canary er útgivið undir CC-BY-4.0, einari permissivari opnari upprunaloyvisskipan. Tú kanst sjálvur vera vertur fyri NVIDIA Canary á tínum egna maskinvara ella brúka okkara vertur útgávu — báðar eru kommersielt nýtiligar.

NVIDIA Canary stuðlar 4 málum. Auto-discover velur rætta málið fyri flestu ljóðini. Tú kanst eisini velja tað manuelt fyri at fáa eina lítla øgiligari nákvæmni.

NVIDIA Canary processes audio at about 45.0x real-time on our GPUs. A 1-hour audio file finishes in under 1 minutes; longer files queue and notify by email when done.

NVIDIA Canary hevur 1B parametrar. Størri modeller hava til at vera meira nákvæmar, men hægri; STT.ai hevur NVIDIA Canary á GPU, so parameter-talið hevur ikki ávirkan á klient-síðuna.

NVIDIA Canary tekur ímóti øllum sniðum, sum STT.ai stuðlar — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, og onnur. Úttøka sum TXT, SRT, VTT, DOCX, JSON, ella PDF.

Ja. Speaker diarization runs alongside NVIDIA Canary for every transcription — each speaker is labelled and you can rename them in the editor afterwards.

Ja. NVIDIA Canary koyrir í okkara umsitingarliga umhvørvi — ljóð verður viðgjørt og slettað sum standard og verður ongantíð brúkt til venjing uttan útgreiniliga atkvøðugreiðslu. Pro-planir leggja til klient-side-kryptering fyri transkriptiónir í hvíld.

No use the compare-stt tool to run NVIDIA Canary against any other supported model on the same audio — you'll see WER, segment count, speaker labels, and confidence scores side-by-side. The NVIDIA Canary vs Whisper Large V3 comparison is the most commonly run.

Ja. Tilgreina "nvidia-canary" sum modelparameter á /v1/transcribe endapunktinum. Python og Node.js SDK'ir innihalda NVIDIA Canary dømi. Frítt API-stig fevnir um 100 minuttir/mánað.

Ja. Tí NVIDIA Canary er CC-BY-4.0-licensed, tú kanst self-host it. STT.ai's open-source page lists the project repo and weights. Most production teams use our hosted version to skip GPU procurement, model swaps, and ops.