Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Česta pitanja
SenseVoice je model govor-na-tekst od FunAudioLLM. STT.ai domaćina SenseVoice na našoj infrastrukturi GPU tako da ga možete koristiti bez opskrbe vlastitim hardverom – upload audio ili video i odaberite SenseVoice iz modela birač.
Na standardnim mjerilima, SenseVoice postiže oko 5.5% Word Pogreška. Preciznost stvarnog svijeta ovisi o kvaliteti zvuka, naglasku i jeziku; za bučne ili naglasene snimke, očekujte nekoliko postotka više WER.
SenseVoice radi na STT.ai besplatnom nivou – svaki posjetitelj dobiva 600 minuta mjesečno bez troškova. Plaćeni planovi dodati više po datoteci ograničenja, privatne transkripte i prioritet reda.
SenseVoice je pušten pod MIT, popustljiva dozvola otvorenog izvora. Možete samostalno voditi SenseVoice na vlastitom hardveru ili koristiti našu domaću verziju – oboje su komercijalno upotrebljivi.
SenseVoice podržava 50 jezika. Auto-detekcija bira pravi jezik za većinu zvuka; možete ga također ručno navesti za mali preciznost lift.
SenseVoice procesa zvuka na oko 50.0x real-time na našem GPU-u. Jedan sat audio datoteka završava u manje od 8802 minuta; duže datoteke redak i obavijestite e-mailom kada se uradi.
SenseVoice ima 8802 parametra. Veći modeli su točniji, ali sporije; STT.ai domaćina SenseVoice na GPU tako da broj parametara ne utječe na performanse vašeg klijenta.
SenseVoice prihvaća svaki oblik STT.ai podrške — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i ostali. Izlaz kao TXT, SRT, VTT, DOCX, JSON, ili PDF.
Da. Zvučnička dijarizacija teče uz SenseVoice za svaku transkripciju — svaki govornik je označen i možete ih nakon toga preimenovati u uredniku.
Da. SenseVoice trči u našem upravljanom okruženju – audio se obrađuje i briše uobičajeno i nikada se ne koristi za trening bez eksplicitne opt-in. Pro planovi dodati klijent-strana enkripcija za transkripte u miru.
Koristite alat usporedbe-stt za pokretanje SenseVoice protiv bilo kojeg drugog podržanog modela na istom zvuku – vidjet ćete WER, broj segmenta, zvučnike, i samopouzdanje rezultate strane-ba-side. SenseVoice protiv Whisper Veliki V3 usporedba je najčešće pokrenuti.
Da. Navedite "sensevoice" kao parametar modela na /v1/transcribe ishodu. Python i Node.js SDKs uključuju SenseVoice primjera. Besplatni API stupanj uključuje 100 minuta/mjesec.
Da. Budući da je SenseVoice je 8802-licensirana, možete ga samostalno voditi. STT.ai stranica otvorenog izvora popisuje repo i utege projekta. Većina proizvodnih timova koristi našu domaćinu za preskočenje GPU nabave, modela swaps, i ops.