Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Bieži uzdoti jautājumi
SenseVoice ir runas-teksta modelis līdz FunAudioLLM. STT.ai uzstādā SenseVoice mūsu GPU infrastruktūrā, lai jūs varētu to izmantot, nenodrošinot savu aparatūru — augšupielādēt audio vai video un izvēlēties SenseVoice no modeļa izvēlētājs.
Par standarta etaloniem 8801% sasniedz aptuveni 8801% vārdu kļūdu rādītājs. Reālā pasaules precizitāte ir atkarīga no audio kvalitātes, akcenta un valodas; trokšņainiem vai izceltiem ierakstiem, sagaida dažus procentu punktus augstāka WER.
SenseVoice iet uz STT.ai bezmaksas līmeni – katrs apmeklētājs saņem 600 minūtes/mēnesi bez maksas. Maksājamie plāni pievienot ilgākus ierobežojumus par failu, privātus transkriptus, un prioritātes rindas.
SenseVoice tiek izlaists zem MIT, atļautā atvērtā pirmkoda licence. Jūs varat paša-host SenseVoice uz savu aparatūru vai izmantot mūsu hostinga versiju — abi ir komerciāli izmantojami.
SenseVoice atbalsta 50 valodas. Auto-noteikšana izvēlas pareizo valodu lielākajai daļai audio; jūs varat arī norādīt to manuāli, lai mazs precizitātes pacēlājs.
SenseVoice apstrādā audio apmēram 50.0x reāllaikā mūsu GPU. 1 stundu audio fails beidzas zem 1 minūtēm; ilgāka failu rinda un paziņo pa e-pastu, kad izdarīts.
SenseVoice ir 234M parametri. Lielāki modeļi mēdz būt precīzāki, bet lēnāki; STT.ai saimnieki SenseVoice par GPU, tāpēc parametru skaits neietekmē jūsu klientu veiktspēju.
SenseVoice pieņem katru formātu STT.ai atbalsta - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI un citi. Izlaide kā TXT, SRT, VTT, DOCX, JSON, vai PDF.
Jā. Skaļruņa diarizācija notiek līdzās 88 000 par katru transkripciju — katrs runātājs ir marķēts un jūs varat pārdēvēt tos redaktorā pēc tam.
Jā. SenseVoice darbojas mūsu pārvaldītajā vidē — audio tiek apstrādāts un dzēsts pēc noklusējuma un nekad netiek izmantots apmācībai bez skaidra opt-in. Pro plāni pievienot klienta pusē šifrēšanu transkriptiem miera stāvoklī.
Izmantojiet salīdzināšanas-stt rīku, lai palaistu SenseVoice pret jebkuru citu atbalstīto modeli tajā pašā audio — jūs redzēsiet WER, segmentu skaitu, skaļruņu etiķetes un uzticamības punktus blakus-by-by. SenseVoice vs Whisper Lielo V3 salīdzinājums ir visbiežāk palaist.
Jā. Norādīt "sensevoice" kā modeļa parametru /v1/tractor galapunktā. Python un Node.js SDK ietver SenseVoice piemērus. Bezmaksas API līmenis ietver 100 minūtes/mēnesi.
Jā. Tā kā SenseVoice ir licences MIT, jūs varat paši-host to. STT.ai atvērtā pirmkoda lapā uzskaitīti projekta repo un svaru. Lielākā daļa ražošanas komandas izmanto mūsu hostinga versiju, lai izlaistu GPU iepirkumu, modeļu mijmaiņas darījumi, un opcijas.