Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Кайвакыт бирелә торган сораулар
SenseVoice — FunAudioLLM-нең сүздән-текстка модель. STT.ai безнең GPU инфраструктурасында урнашкан, шуңа күрә сез аны үз аппаратурагызны тәэмин итмичә куллана аласыз — аудио яки видеоны урнаштырыгыз һәм модель сайлап алучыдан SenseVoice-не сайлагыз.
SenseVoice стандарт бәяләүләрдә сүз хаталары 5.5% тәшкил итә. Реаль дөньяда дөреслек аудио сыйфатына, акцентка һәм телгә бәйле; тавышлы яки акцентлы язу өчен, WER ны берничә процентка арттырырга мөмкин.
SenseVoice STT.ai-нең бушлай дәрәҗәсендә эшли — һәрбер кунак 600 минут / ай бушлай ала. түләүле планнар файлга озынрак чикләүләр, шәхси транскрипцияләр һәм приоритетлы чиратлаштыру өсти.
SenseVoice MIT лицензиясе нигезендә чыгарыла, ул ачык чыганак лицензиясе. Сез SenseVoice-не үз җайланмагызда урнаштыра аласыз яки безнең урнаштырылган версияне куллана аласыз — икесе дә коммерцияле куллануга яраклы.
SenseVoice 50 телне яклый. Аудио өчен дөрес телне автоматик ачыклау сайлый; аны үзегезгә туры китереп тә билгеләп була, тик бу дөреслекне бераз арттыра.
SenseVoice безнең GPUларда 50.0x реаль вакыт белән аудио эшкәртә. 1 сәгатьлек аудио файл 1 минут эчендә тәмамлана; озынрак файллар чиратка куела һәм эш тәмамлангач электрон почта аша хәбәр ителә.
SenseVoiceдә 234M параметрлары бар. Зуррак модельләр төгәлрәк, ләкин зәгыйфьрәк; STT.ai SenseVoiceне график процессорда урнаштыра, шуңа күрә параметрлар саны клиент ягы эшчәнлегенә йогынты ясамый.
SenseVoice STT.ai тарафыннан якланган һәр форматны кабул итә — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI һәм башкалар.
SenseVoice сүзлекнең һәрберсе өчен сөйләүче диаризациясе эшли — һәр сөйләүчегә тамга куела һәм соңрак редакторда аларны исемнәре үзгәртелә.
Әйе. SenseVoice безнең идарә ителгән тирәлектә эшли — аудио эшкәртелә һәм юкка чыгарыла һәм ачыктан-ачык кушылмаусыз өйрәтү өчен беркайчан да кулланылмый. Про планнары клиент тарафыннан шифрлауны ялгыз трактовкаларга өсти.
SenseVoiceне башка башка ярдәм ителгән модельләр белән бер үк аудиода чагыштыру өчен compare-stt инструментын кулланыгыз — сез WER, сегментлар саны, тавыш язучылары һәм ышанычлылык күрсәткечләрен бер-бер артлы күрерсез. SenseVoice һәм Whisper Large V3 чагыштыруы иң еш кулланыла.
Әйе. /v1/transcribe ахыргы ноктасында модель параметры буларак "sensevoice"не күрсәтегез. Python һәм Node.js SDKлары SenseVoice мисалын кертәләр. Бушлай API катламы айга 100 минутны тәшкил итә.
Әйе. SenseVoice MIT-лицензияләнгән булганлыктан, сез аны үзегез урнаштыра аласыз. STT.ai'ның ачык чыганаклы битендә проектның репо һәм авырлыклары күрсәтелгән. Продукция төркемнәре безнең урнаштырылган версияне GPU сатып алу, модель алмашу һәм опсларны калдыру өчен кулланалар.