Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Kesyon ki poze souvan
SenseVoice se yon modèl pale-a-tèks pa FunAudioLLM. STT.ai anrejistre SenseVoice sou infrastrikti GPU nou an pou ou ka itilize li san ou pa bezwen enstale pwòp aparèy ou an. Upload videyo oswa son epi chwazi SenseVoice nan modèl ki chwazi a.
Sou baz tès standard, SenseVoice rive nan alantou 5.5% Word Rate Erè. Real-mond egzakteman depann sou bon jan kalite son, accent, ak lang; pou enskri briyan oswa accented, espere kèk pwen pousan pi wo WER.
SenseVoice kouri sou STT.ai's gratis tiwa - chak vizitè jwenn 600 minit / mwa san okenn pri. plan peye ajoute pi long limit pou chak dosye, transkript prive, ak wout la nan liy priyorite.
SenseVoice se yon lojisyèl ki disponib anba lisans MIT, yon lisans ki pèmèt pou itilize lojisyèl ki gen sous louvri. Ou ka itilize SenseVoice sou aparèy ou menm oswa ou ka itilize vèsyon nou an ki disponib sou entènèt. Tout de sa ka itilize pou rezon komèsyal.
SenseVoice sipòte 50 lang. Deteksyon otomatik chwazi lang ki kòrèk la pou pifò son; ou ka tou endike li pa men pou yon ti kras pi byen.
SenseVoice ap trete son an nan yon vitès de 50.0x nan tan reyèl sou GPU nou yo. Yon dosye son 1 èdtan fini nan mwens pase 1 minit. Fichiers ki pi long yo pral mete nan yon liy epi yo pral notifye pa imèl lè yo fin fè.
SenseVoice gen 234M paramèt. Pi gwo modèl yo gen tandans pou yo pi egzat men pi lent; STT.ai òganize SenseVoice sou GPU pou ke kantite paramèt pa afekte pèfòmans bò kliyan ou a.
SenseVoice aksepte chak fòma STT.ai sipòte - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ak lòt moun.Soti nan kòm TXT, SRT, VTT, DOCX, JSON, oswa PDF.
Diarization pale kouri ansanm ak SenseVoice pou chak transkriptyon — chak pale se étiqueté ak ou ka re-nome yo nan editè a apre sa.
SenseVoice kouri nan environnement nou an managed — son se trete ak efase pa default ak pa janm itilize pou fòmasyon san opt-an esplicite. Pro plan yo ajoute enkripsyon bò kliyan pou transkript nan repoze.
Itilize zouti konpare-stt pou kouri SenseVoice kont nenpòt lòt modèl ki sipòte sou menm son - ou pral wè WER, konte segman, atik pale, ak pwen konfidans bò-a-bò. SenseVoice vs Whisper Large V3 konparasyon se pi souvan kouri.
Wi. Espesifik "sensevoice" kòm paramèt modèl la sou /v1/transcribe pwen an bout. Python ak Node.js SDKs gen ladan SenseVoice egzanp. Gratis API nivo gen ladan 100 minit / mwa.
Wi. paske SenseVoice se MIT-licensed, ou ka self-host li. STT.ai's open-source page lists the project repo and weights. Pifò ekip pwodiksyon itilize nou an ki estoke vèsyon pou sispann GPU akizisyon, swaps modèl, ak ops.