Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Често постављана питања
SenseVoice је модел говор-текст од FunAudioLLM. STT.ai домаћина SenseVoice на нашој ГПУ инфраструктури тако да га можете користити без обезбеђења сопственог хардвера — слање аудио или видео и одабирање SenseVoice из модела берача.
На стандардним стандардним стандардима, SenseVoice постиже око 5.5% процена грешака речи. Прецизност реалног света зависи од квалитета звука, акцента и језика; за бучне или акцентиране снимке, очекује се неколико процената вишег ВЕР‐ а.
SenseVoice ради на STT.ai-овом слободном нивоу — сваки посетилац добија 600 минута месечно без трошкова. Плаћени планови додају више граница по фајлу, приватне транскрипте и приоритетне редоследе.
SenseVoice је ослобођено под MIT, попустљива дозвола отвореног извора, можете да водите SenseVoice на сопственом хардверу или да користите нашу верзију домаћина — оба су комерцијално коришћена.
SenseVoice подржава 50 језике. Аутоматско откривање изабира прави језик за већину звука; такође га ручно можете задати за мали лифт тачности.
SenseVoice процесира звук на око 50.0x реално време на нашим ГПУ‐ овима. Један сат аудио фајла завршава испод 8802 минута; дуже фајлове у реду и обавештење е‐ поштом.
SenseVoice има 8802 параметра. Већи модели обично су прецизнији, али спорији; STT.ai домаћина SenseVoice на ГПУ, тако да број параметара не утиче на перформансе вашег клијента.
SenseVoice прихвата сваки формат STT.ai подршке — МП3, ВАВ, М4А, ФЛАЦ, ОГГ, МП4, МКВ, МОВ, ВебМ, АВИ и остали. Излаз као ТХТ, СРТ, ВТТ, ДОКС, ЈСОН или ПДФ.
Дијаризација звучника ради поред SenseVoice за сваку транскрипцију — сваки звучник је означен и можете да их преименујете у уређивачу после тога.
Да. SenseVoice ради у нашем управљеном окружењу — аудио се обрађује и обрише подразум› ијевано и никада се не користи за обуку без експлицитне опције. Про планови додају шифровање са стране клијента за транскрипте у миру.
Користите алатку за упоређивање да покренете SenseVoice против било ког другог подржаног модела на истом звуку — видећете ВЕР, број сегмента, налепнице звучника и поверљиве резултате са стране поред. Најчешће је поређење SenseVoice против Whisper Велики В3.
Да. Задајте „ sensevoice “ као параметар модела на крајњој тачки /v1/transcribed. Питон и Node.js СДК укључују SenseVoice примера. Слободни АПИ низ укључује 100 минута/месечно.
Да, зато што је SenseVoice 8802-лицензиран, можете да га водите. STT.ai отворене странице набраја репо и тежине пројекта. Већина продуцентских тимова користи нашу домаћинску верзију да прескочите ГПУ набавке, замене модела и операције.