Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Korduma kippuvad küsimused
SenseVoice on kõne-teksti mudel FunAudioLLM. STT.ai hosts SenseVoice meie GPU infrastruktuuri, nii et saate seda kasutada ilma oma riistvara ~ üles laadida audio või video ja valida SenseVoice mudeli valija.
Standardsete võrdlusandmete puhul saavutab SenseVoice Wordi veamäära ligikaudu 5.5%. Reaalmaailma täpsus sõltub heli kvaliteedist, aktsendist ja keelest; lärmakate või aktsendiga salvestuste puhul oodake mõnda protsendipunkti kõrgemat WER-i.
SenseVoice töötab STT.ai vaba tase ~ iga külastaja saab 600 minutit kuus tasuta. Tasulised plaanid lisada enam ühe faili piirangud, era ärakirju, ja prioriteet järjekorda.
SenseVoice vabastatakse all MIT, lubatud avatud lähtekoodiga litsentsi. Võite ise-host SenseVoice oma riistvara või kasutada meie võõrustatud versioon ~ Mõlemad on kaubanduslikult kasutatavad.
SenseVoice toetab 50 keelt. Automaatne tuvastamine valib enamiku audio jaoks õige keele; seda saab ka käsitsi määrata väikese täpsuse tõstmiseks.
SenseVoice töötleb audio umbes 50.0x reaalajas meie GPUs. 1-tunnine audiofail lõpetab alla 1 minutit; pikem faile järjekorda ja teatada e-posti teel, kui tehtud.
SenseVoice on 234M parameetrid. Suuremad mudelid kipuvad olema täpsem, kuid aeglasem; STT.ai hosts SenseVoice on GPU nii parameeter arv ei mõjuta oma kliendi poolel jõudlust.
SenseVoice aktsepteerib iga formaat STT.ai toetab ~ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, jt. Väljund TXT, SRT, VTT, DOX, JSON, või PDF.
Jah. Spiiker diarization töötab kõrvuti SenseVoice iga transkriptsioon ~ iga kõneleja on märgistatud ja saate ümber nimetada neid toimetaja hiljem.
Jah. SenseVoice jookseb meie hallatav keskkond ~ audio on töödeldud ja kustutatud vaikimisi ja kunagi kasutada koolitus ilma selge opt-in. Pro plaanid lisada kliendipoolne krüptimine transkriptid puhkeolekus.
Kasutage võrdlus-stt tööriist käivitada SenseVoice vastu teiste toetatud mudeli sama audio ~ näete WER, segment arv, kõlari sildid, ja enesekindluse skoor külg-küljelt. SenseVoice vs Whisper Large V3 võrdlus on kõige sagedamini käivitada.
Jah. Täpsustada "sensevoice" mudeli parameeter /v1/transcrip tulemusnäitaja. Python ja Node.js SDKs sisaldavad SenseVoice näited. Tasuta API tase sisaldab 100 minutit/kuus.
Jah. Kuna SenseVoice on MIT-litsentsiga, saate ise-host seda. STT.ai avatud lähtekoodiga lehekülg loetleb projekti repo ja kaalud. Enamik tootmismeeskonnad kasutavad meie võõrustatud versiooni vahele GPU hanke, mudeli vahetuste ja operatsioonide.