Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Maiz egiten diren galderak
SenseVoice FunAudioLLMren hizketa-testu modelo bat da. STT.aik SenseVoice gure GPU azpiegituran ostatzen du, zure hardwarea hornitu gabe erabil dezakezu, audioa edo bideoa igo eta SenseVoice aukeratu modelo-hautatzailean.
Erreferentzia estandarretan, SenseVoicek %5.5 inguruko hitzen errore-tasa lortzen du. Benetako zehaztasuna audio-kalitatearen, azentuaren eta hizkuntzaren araberakoa da; grabazio zaratatsu edo azentudunetarako, WER ehuneko puntu batzuk handiagoa espero daiteke.
SenseVoice STT.airen doako mailan exekutatzen da — bisitari bakoitzak 600 minutu/hilabete jasotzen ditu kosturik gabe. Ordainpeko planek fitxategiko muga luzeagoak gehitzen dituzte, transkribapen pribatuak eta lehentasun ilara.
SenseVoice MIT lizentziapean argitaratzen da, kode irekiko lizentzia permisiboa. Zure hardwarean SenseVoice ostatatu dezakezu edo gure ostatatutako bertsioa erabili — biak erabil daitezke merkataritzan.
SenseVoicek 50 hizkuntza onartzen ditu. Auto-detekzioak hizkuntza egokia hautatzen du audio gehienentzat; eskuz ere zehaztu dezakezu zehaztasun txikiagoa lortzeko.
SenseVoice-k audioa 50.0x denbora errealean prozesatzen du gure GPUetan. Ordu bateko audio-fitxategi bat 1 minututan amaitzen da; fitxategi luzeagoak ilaran jarri eta e-postaz jakinarazi egiten dira amaitzen direnean.
SenseVoice-k 234M parametro ditu. Modelo handiagoak zehatzagoak izaten dira, baina motelagoak; STT.ai-k SenseVoice GPUan gordetzen du, beraz parametroen kopuruak ez du eraginik izango bezeroaren errendimenduan.
SenseVoiceek STT.aik onartzen dituen formatu guztiak onartzen ditu: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI eta beste batzuk. Irteera TXT, SRT, VTT, DOCX, JSON edo PDF gisa.
Bai. Hiztun-diarizazioa SenseVoicerekin batera exekutatzen da transkribapen bakoitzean — hiztun bakoitza etiketatuta dago eta gero editorean izena aldatu ahal izango duzu.
Bai. SenseVoice gure kudeatutako ingurunean exekutatzen da — audioa lehenespenez prozesatu eta ezabatu egiten da, eta ez da inoiz entrenamendurako erabiltzen, aldez aurretik aukeratu gabe. Pro planek bezeroaren aldeko enkriptatzea gehitzen dute transkribapen geldituetan.
Erabili compare-stt tresna SenseVoice audio beraren beste edozein onartutako modeloren aurka exekutatzeko — WER, segmentu-kopurua, bozgorailuen etiketak eta konfiantza-puntuak aldi berean ikusiko dituzu. SenseVoice eta Whisper Large V3 konparaketa da gehien erabiltzen dena.
Bai. Zehaztu "sensevoice" modeloaren parametro gisa /v1/transcribe amaierako puntuan. Python eta Node.js SDKek SenseVoice adibidea dute. API doako maila 100 minutukoa da hilean.
Bai. SenseVoice MIT lizentziaduna denez, zeure burua ostatatu dezakezu. STT.airen kode irekiko orrialdean proiektuaren errepositorioa eta pisuak zerrendatzen dira. Produkzio-talde gehienek gure ostatatutako bertsioa erabiltzen dute GPU-ren erosketak, modeloen trukaketak eta operazioak saltatzeko.