Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Často kladené otázky
SenseVoice je model prevodu reči na text od spoločnosti FunAudioLLM. STT.ai hosťuje SenseVoice na našej infraštruktúre GPU, takže ho môžete používať bez zriaďovania vlastného hardvéru. Nahrajte zvuk alebo video a vyberte SenseVoice z výberu modelu.
V štandardných testoch dosahuje SenseVoice okolo 5.5% Word Error Rate.Reálna presnosť závisí od kvality zvuku, prízvuku a jazyka; pre hlučné alebo akcentované nahrávky očakávajte o niekoľko percentuálnych bodov vyššiu WER.
SenseVoice beží na bezplatnej úrovni STT.ai - každý návštevník dostane 600 minút / mesiac bezplatne.Platené plány pridávajú dlhšie limity na súbor, súkromné prepisy a prioritné rady.
SenseVoice je vydaný pod MIT, povolenou open-source licenciou.SenseVoice môžete hosťovať na svojom vlastnom hardvéri alebo použiť našu hosťovanú verziu — obe sú komerčne použiteľné.
SenseVoice podporuje 50 jazykov.Automatická detekcia vyberie správny jazyk pre väčšinu zvuku; môžete ho tiež zadať manuálne pre malý nárast presnosti.
SenseVoice spracováva zvuk približne 50.0x v reálnom čase na našich grafických procesoroch. 1-hodinový zvukový súbor sa dokončí za menej ako 1 minút. Dlhšie súbory sa ukladajú do frontu a po dokončení sa upozornia e-mailom.
Väčšie modely majú tendenciu byť presnejšie, ale pomalšie; STT.ai hostí SenseVoice na GPU, takže počet parametrov neovplyvňuje výkon na strane klienta.
SenseVoice prijíma všetky formáty, ktoré podporuje STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a ďalšie.Výstup ako TXT, SRT, VTT, DOCX, JSON alebo PDF.
Diarizácia hovoriacich beží spolu s SenseVoice pre každý prepis — každý hovoriaci je označený a môžete ho neskôr premenovať v editore.
Áno, SenseVoice je spustené v našom spravovanom prostredí – zvuk sa predvolene spracováva a odstraňuje a nikdy sa nepoužíva na školenie bez výslovného súhlasu. Plány Pro pridávajú šifrovanie na strane klienta pre prepisy v pokoji.
Použite nástroj compare-stt na porovnanie SenseVoice s akýmkoľvek iným podporovaným modelom na rovnakom zvuku. Uvidíte WER, počet segmentov, popisky reproduktorov a skóre spoľahlivosti vedľa seba. Porovnanie SenseVoice vs Whisper Large V3 je najčastejšie používané.
Áno. Ako parameter modelu v koncovom bode /v1/transcribe zadajte hodnotu sensevoice. Súpravy SDK pre jazyk Python a jazyk Node.js obsahujú príklady pre hodnotu SenseVoice.
Áno, pretože SenseVoice je licencovaný na MIT, môžete ho hosťovať sami.Stránka s otvoreným zdrojovým kódom STT.ai uvádza úložisko projektu a váhy.Väčšina produkčných tímov používa našu hosťovanú verziu na preskočenie obstarávania GPU, výmen modelov a operácií.