Хато ҳақида хабар бериш / Хусусият талаби

Бу билан транскрипциялаш SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Очиқ аудио ва видео билан ишлайди. DRM-хавфсиз мазмун қўлланилмайди.

Фаолиятни кучайтириш учун янгилаш

Шахсий транскрипция

Транскрипт билан суҳбатлашиш

Pro билан қулфни очиш →

Файлни бу ерга ташланг ёки кўриш учун босинг

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2GB гача

Бир неча файлларни юклаш Про билан

Фаолиятни кучайтириш учун янгилаш

Шахсий транскрипция

Транскрипт билан суҳбатлашиш

Pro билан қулфни очиш →

Фаолиятни кучайтириш учун янгилаш

Реал вақтдаги сўзлашув матнга. AI сиз гапираётганда автоматик тузатади - тўғрилиги гапириш узоқроқ бўлганида яхшиланади.

Аввал микрофонингизни текширинг

Кунига 10 қийматли дақиқа 600 дақиқа бепул Кредит картаси йўқ Шифрланмаган

Бепул рўйхатдан ўтинг →

5.5%

WER

Тиллар

50.0x

Тезлик

MIT

Лицензия

Маълумот SenseVoice

SenseVoice FunAudioLLM'дан транскрипциядан ташқарига чиқадиган сўзлашув моделидир. У 50 дан ортиқ тилларни қўллаб-қувватлайди ва бир моделда ҳиссиётларни таниб олиш, аудио ҳодисаларни аниқлаш ва матнларни акси нормаллаштириш имкониятларини ўз ичига олади.

Қопланган тиллар SenseVoice

Inglizcha

Ispancha

Fransuzcha

Nemischa

Xitoy

Yapon

Koreyscha

Portugalcha

Arab

Hind

Ruscha

Italyan

Niderland

Turk

Polyakcha

Shved

Indonez

Tay

Vyetnam

Chex

Grek

Rumincha

Venger

Ivrit

Dan

Fincha

Norveg

Ukrain

Malay

Bengal

Модель маълумотлари

ПровайдерFunAudioLLM
Архитектура-
ЛицензияMIT
ЯнгиландиMar 2026

Муносабатли моделлар

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Кўп бериладиган саволлар

SenseVoice FunAudioLLM томонидан сўздан матнга моделдир. STT.ai SenseVoice ни GPU инфратузилмасида сақлайди, шунинг учун сиз уни ўз жиҳозингизни таъминламасдан фойдалана оласиз — аудио ёки видео юклаб олиб, SenseVoice ни модел танловчидан танлайсиз.

Стандарт бенчмаркларда SenseVoice та сўз хатосининг 5.5% га етишини кўрсатади. Ҳақиқий аниқлик аудио сифати, акцент ва тилга боғлиқ; шовқинли ёки акцентли ёзувлар учун WER дан бир неча фоиз юқори бўлишини кутиш мумкин.

SenseVoice STT.ai'нинг бепул даражасида ишлайди - ҳар бир ташриф буюрувчи бепул ишга тушириш учун 600 дақиқа олади. Умумий тўловли планлар ҳар бир файл учун узоқроқ чегараларни, шахсий транскриптларни ва устувор навбатни қўшиб беради.

SenseVoice MIT лицензияси остида чиқарилган, бу оммавий очиқ манбали лицензиядир. Сиз SenseVoice ни ўз қурилмангизда ёки бизнинг хост қилинган версиямизда ўзингизга жойлаштирсангиз бўлади — иккаласи ҳам савдо учун ишлатилиши мумкин.

SenseVoice 50 тилларни қўллаб-қувватлайди. Авто-таърифлаш кўплаб аудио учун тўғри тилни танлайди; сиз уни кичик аниқлик учун қўлда ҳам белгилашингиз мумкин.

SenseVoice аудиони GPUларда 50.0x реал вақтда ишлайди. 1 соатлик аудио файл 1 дақиқада тугайди; узун файллар навбатда туради ва тугаганида электрон почта орқали хабар беради.

SenseVoice нинг 234M параметрлари бор. Кўпроқ моделлар аниқроқ, аммо секинроқ; STT.ai GPUда SenseVoice ни қабул қилади, шунинг учун параметрлар сони сизнинг клиент томони ишлашингизга таъсир қилмайди.

SenseVoice STT.ai қўллаб-қувватлайдиган барча форматларни қабул қилади — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ва бошқалар. Тўқима TXT, SRT, VTT, DOCX, JSON ёки PDF шаклида.

Ҳа. Ҳар бир транскрипция учун SenseVoice билан биргаликда сўзловчилар рўйхати ишлайди - ҳар бир сўзловчи белгиланади ва кейинчалик уларни редакторда қайта номлашингиз мумкин.

Ҳа. SenseVoice бизнинг бошқариладиган муҳитда ишлайди — аудио ишланади ва стандарт тарзда ўчирилади ва ҳеч қачон очиқ танловсиз машғулот учун фойдаланилмайди. Pro режалари дам олганда ёзилган транскриптлар учун клиент томони шифрлашини қўшиб беради.

SenseVoice'ни бошқа қўллаб-қувватланадиган моделлар билан бир хил аудиода ишлатиш учун compare-stt асбобидан фойдаланинг — сиз WER, сегментлар сони, овоз берувчиларнинг белгилари ва ишончлилик балларини бир-бирига қарама-қарши кўришингиз мумкин. SenseVoice ва Whisper Large V3 ўртасидаги таққослашни энг кўп ишлатиш мумкин.

Ҳа. /v1/transcribe охирида "sensevoice" модели параметрини кўрсатинг. Python ва Node.js SDK лар SenseVoice мисолларни ўз ичига олади. Бепул API даражаси ойига 100 дақиқани ўз ичига олади.

Ҳа. SenseVoice MIT лицензиясига эга бўлгани учун, сиз уни ўзингиз хост қила оласиз. STT.ai'нинг очиқ манба саҳифасида лойиҳа репозиторияси ва вазнлари кўрсатилган. Продукция жамоаларининг кўпчилиги GPU харид қилиш, модел алмаштириш ва ишга тушириш учун бизнинг хост қилинган версиямизни фойдаланади.

Бу билан транскрипциялаш SenseVoice

Маълумот SenseVoice

Қопланган тиллар SenseVoice

Модель маълумотлари

Муносабатли моделлар

Кўп бериладиган саволлар

SenseVoice нима?

SenseVoice қанчалик аниқ?

SenseVoice фойдаланиш учун бепулми?

SenseVoice қайси лицензиядан фойдаланади?

SenseVoice қанча тилларни қўллаб-қувватлайди?

SenseVoice қанча тез?

SenseVoice модели қанчалик катта?

SenseVoice қайси аудио форматларни транскрипция қила олади?

SenseVoice кўплаб овозлиларни аниқлай оладими?

SenseVoice ишлатилганда менинг маълумотларим шахсийми?

SenseVoice бошқа STT моделлари билан қандай таққослаши мумкин?

Мен SenseVoice'ни API орқали ишлата оламанми?

Мен ўз серверимда SenseVoice'ни ишлата оламанми?