Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Často kladené otázky
SenseVoice je ukázkový model od FunAudioLLM. STT.ai hostů SenseVoice na naší GPU infrastruktuře, takže ji můžete použít bez poskytnutí vlastního hardwaru a nahrát audio nebo video a vybrat SenseVoice z modelového sběrače.
Na standardních referenčních hodnotách dosahuje SenseVoice přibližně 5.5% Word Error Rate. Skutečná přesnost závisí na kvalitě zvuku, přízvuku a jazyku; u hlučných nebo akcentovaných nahrávek očekáváme o několik procentních bodů vyšší WER.
SenseVoice běží na STT.ai volných úrovní, každý návštěvník dostane 600 minut / měsíc bez nákladů. Placené plány přidat déle na-file limity, soukromé přepisy, a prioritní fronty.
SenseVoice je uvolněno pod MIT, povolná open-source licence. Můžete self-host SenseVoice na vašem vlastním hardwaru, nebo použít naši hostitelskou verzi dírky oba jsou komerčně použitelné.
SenseVoice podporuje 50 jazyků. Auto-detekce vybírá správný jazyk pro většinu audio; můžete jej také ručně zadat pro malý výtah přesnosti.
SenseVoice zpracovává audio na cca 50.0x v reálném čase na našich GPU. 1-hodinový audio soubor končí za méně než 1 minut; delší fronta souborů a upozornění e-mailem, když je hotovo.
SenseVoice má 234M parametrů. Větší modely mají tendenci být přesnější, ale pomalejší; STT.ai hostů SenseVoice na GPU, takže počet parametrů nemá vliv na výkon na straně klienta.
SenseVoice přijímá každý formát STT.ai podporuje MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a další. Výstup jako TXT, SRT, VTT, DOCX, JSON, nebo PDF.
Ano. Diarizace reproduktorů vede vedle SenseVoice pro každý přepis a každý reproduktor je označen a můžete je přejmenovat v editoru později.
Ano. SenseVoice běží v našem řízeném prostředí Audio je zpracováno a smazáno ve výchozím nastavení a nikdy se nepoužívá pro trénink bez explicitního opt-inu. Pro plány přidat klient-strana šifrování pro přepisy v klidu.
Pomocí porovná-stt nástroj spustit SenseVoice proti jakémukoliv jinému podporovanému modelu na stejném zvuku, budete vidět WER, počet segmentů, reproduktory štítky, a sebedůvěry skóre vedle sebe. SenseVoice vs Whisper Large V3 srovnání je nejčastějším spuštěním.
Ano. Zadejte "sensevoice" jako parametr modelu na cílovém parametru /v1/transcribe. Python a Node.js SDKs obsahují SenseVoice příklady. Bezplatná úroveň API zahrnuje 100 minut/měsíc.
Ano. Vzhledem k tomu, SenseVoice je MIT-licencován, můžete si ho sami-hostit. STT.ai open-source stránky uvádí projekt repo a váhy. Většina výrobních týmů používá naši hostitelskou verzi přeskočit GPU zadávání zakázek, modelové swapy, a ops.