Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Pitakon kang asring diajukake
STT.ai host SenseVoice ing infrastruktur GPU kita supaya sampeyan bisa nggunakake tanpa provisioning piranti lunak dhewe - upload audio utawa video lan pilih SenseVoice saka model pitcher.
Ing standar benchmarks, SenseVoice ngrampungake sekitar 5.5% Word Error Rate. Real-world akurasi gumantung ing kualitas audio, accent, lan basa; kanggo noisey utawa accented rekaman, ngarepake sawetara persentase poin luwih dhuwur WER.
SenseVoice dioperasikaké ing tingkat gratis STT.ai - saben pengunjung nampa 600 menit / wulan tanpa biaya. rencana dibayar nambah watesan per-file sing luwih dawa, transkripsi pribadi, lan prioritas queueing.
SenseVoice dirilis ing ngisor MIT, lisensi sumber terbuka sing permisif. Sampeyan bisa nginstal SenseVoice ing piranti keras dhewe utawa nggunakake versi sing dihost - loro-loroné bisa digunakake kanthi komersial.
SenseVoice nyokong 50 basa. Auto-deteksi milih basa kang bener kanggo akèh audio; sampeyan uga bisa nyetel kanthi manual kanggo nambah akurasi.
SenseVoice ngproses audio ing kira-kira 50.0x real-time ing GPU kita. Fail audio 1 jam rampung ing ngisor 1 menit; file luwih dawa ing gulungan lan dilaporake liwat email nalika rampung.
SenseVoice duwé parameter 234M. Model kang luwih gedhé luwih akurat nanging luwih lambat; STT.ai duwé host SenseVoice ing GPU supaya penghitungan parameter ora ngrusak kinerja klien.
SenseVoice nampa saben format STT.ai nyokong - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, lan liyane. Output minangka TXT, SRT, VTT, DOCX, JSON, utawa PDF.
SenseVoice diarization speakers dijalanaken kaliyan saben transkripsi - saben speaker dipunlabel lan sampeyan saged mènèhi jeneng anyar ing editor.
Ya. SenseVoice dijalanaké ing lingkungan sing diurus — audio diproses lan dipasak kanthi pigura lan ora pernah digunakake kanggo latihan tanpa opt-in eksplisit. Rencana Pro nambah enkripsi klien-sisi kanggo transkripsi nalika ora aktif.
Gunakaké alat compare-stt kanggo nglakokaké SenseVoice karo modél liya kang didhukung ing audio kang padha — sampeyan bakal ndeleng WER, penghitung segmen, label speaker, lan skor confidence side-by-side. Perbandingan SenseVoice vs Whisper Large V3 iku sing paling umum dilakokaké.
Ya. Nyathet "sensevoice" minangka parameter model ing /v1/transcribe endpoint. Python lan Node.js SDKs ngemot conto SenseVoice. Lapisan API gratis ngemot 100 menit/wulan.
Ya. Amargi SenseVoice dipunlisensi MIT, sampeyan saged nghostaken piyambakipun. Lampiran sumber-bukah STT.ai nyathet repo proyèk lan bobot. Kathah tim produksi ingkang ngginakaken versi ingkang dipunhostaken kanggé nglewati GPU procurement, model swaps, lan ops.