Txostendu programa- errorea / Eskaera

Transkribatu honekin SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Audio eta bideo publikoekin lan egiten du. DRM-rekin babestutako edukia ez da onartzen.

Hobetua bertsio-berritzeko

Transkribapen pribatua

Berriketa transkribatuarekin

Desblokeatu Pro-rekin →

Arrastatu fitxategia hona edo egin klik arakatzeko

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2 GB arte

Igo fitxategi anitz batch moduan Pro-rekin

Hobetua bertsio-berritzeko

Transkribapen pribatua

Berriketa transkribatuarekin

Desblokeatu Pro-rekin →

Hobetua bertsio-berritzeko

Hitzetik testura denbora errealean. AIk automatikoki zuzentzen du hitz egiten duzunean — zehaztasuna hobetzen da hizketa luzeagoa denean.

Probatu mikrofonoa lehenik

10 minutu libre/eguna 600 min doan izena ematearekin Kreditu-txartelik ez Enkriptatuta

Izena eman doan →

5.5%

WER

Hizkuntzak

50.0x

Abiadura

MIT

Lizentzia

Honi buruz SenseVoice

SenseVoice FunAudioLLM-ren hizketaren oinarrizko eredua da, transkribapenaz haratago doana. 50 hizkuntza baino gehiago onartzen ditu eta emozioak ezagutzeko, audio-gertaeren detekziorako eta testuaren alderantzizko normalizazioaren gaitasunak eredu bakar batean biltzen ditu.

Onartutako hizkuntzak SenseVoice

Ingelesa

Gaztelania

Frantsesa

Alemana

Txinera

Japoniera

Koreera

Portugesa

Arabiera

Hindia

Errusiera

Italiera

Nederlandera

Turkiera

Poloniera

Suediera

Indonesiera

Thailandiera

Vietnamera

Txekiera

Greziera

Errumaniera

Hungariera

Hebreera

Daniera

Finlandiera

Norvegiera

Ukrainera

Malaysiera

Bengalera

Modeloaren informazioa

HornitzaileaFunAudioLLM
Arkitektura-
LizentziaMIT
EguneratutaMar 2026

Erlazionatutako modeloak

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Maiz egiten diren galderak

SenseVoice FunAudioLLMren hizketa-testu modelo bat da. STT.aik SenseVoice gure GPU azpiegituran ostatzen du, zure hardwarea hornitu gabe erabil dezakezu, audioa edo bideoa igo eta SenseVoice aukeratu modelo-hautatzailean.

Erreferentzia estandarretan, SenseVoicek %5.5 inguruko hitzen errore-tasa lortzen du. Benetako zehaztasuna audio-kalitatearen, azentuaren eta hizkuntzaren araberakoa da; grabazio zaratatsu edo azentudunetarako, WER ehuneko puntu batzuk handiagoa espero daiteke.

SenseVoice STT.airen doako mailan exekutatzen da — bisitari bakoitzak 600 minutuko hasiera-denbora du, kosturik gabe. Ordainpeko planek fitxategiko muga luzeagoak gehitzen dituzte, transkribapen pribatuak eta lehentasun-ilara.

SenseVoice MIT lizentziapean argitaratzen da, kode irekiko lizentzia permisiboa. Zure hardwarean SenseVoice ostatatu dezakezu edo gure ostatatutako bertsioa erabili — biak erabil daitezke merkataritzan.

SenseVoicek 50 hizkuntza onartzen ditu. Auto-detekzioak hizkuntza egokia hautatzen du audio gehienentzat; eskuz ere zehaztu dezakezu zehaztasun txikiagoa lortzeko.

SenseVoice-k audioa 50.0x denbora errealean prozesatzen du gure GPUetan. Ordu bateko audio-fitxategi bat 1 minututan amaitzen da; fitxategi luzeagoak ilaran jarri eta e-postaz jakinarazi egiten dira amaitzen direnean.

SenseVoice-k 234M parametro ditu. Modelo handiagoak zehatzagoak izaten dira, baina motelagoak; STT.ai-k SenseVoice GPUan gordetzen du, beraz parametroen kopuruak ez du eraginik izango bezeroaren errendimenduan.

SenseVoiceek STT.aik onartzen dituen formatu guztiak onartzen ditu: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI eta beste batzuk. Irteera TXT, SRT, VTT, DOCX, JSON edo PDF gisa.

Bai. Hiztun-diarizazioa SenseVoicerekin batera exekutatzen da transkribapen bakoitzean — hiztun bakoitza etiketatuta dago eta gero editorean izena aldatu ahal izango duzu.

Bai. SenseVoice gure kudeatutako ingurunean exekutatzen da — audioa lehenespenez prozesatu eta ezabatu egiten da, eta ez da inoiz entrenamendurako erabiltzen, aldez aurretik aukeratu gabe. Pro planek bezeroaren aldeko enkriptatzea gehitzen dute transkribapen geldituetan.

Erabili compare-stt tresna SenseVoice audio beraren beste edozein onartutako modeloren aurka exekutatzeko — WER, segmentu-kopurua, bozgorailuen etiketak eta konfiantza-puntuak aldi berean ikusiko dituzu. SenseVoice eta Whisper Large V3 konparaketa da gehien erabiltzen dena.

Bai. Zehaztu "sensevoice" modeloaren parametro gisa /v1/transcribe amaierako puntuan. Python eta Node.js SDKek SenseVoice adibidea dute. API doako maila 100 minutukoa da hilean.

Bai. SenseVoice MIT lizentziaduna denez, zeure burua ostatatu dezakezu. STT.airen kode irekiko orrialdean proiektuaren errepositorioa eta pisuak zerrendatzen dira. Produkzio-talde gehienek gure ostatatutako bertsioa erabiltzen dute GPU-ren erosketak, modeloen trukaketak eta operazioak saltatzeko.

Transkribatu honekin SenseVoice

Honi buruz SenseVoice

Onartutako hizkuntzak SenseVoice

Modeloaren informazioa

Erlazionatutako modeloak

Maiz egiten diren galderak

Zer da SenseVoice?

Zenbat da SenseVoice?

SenseVoice doan da?

Zer lizentzia erabiltzen du SenseVoice-k?

Zenbat hizkuntza onartzen ditu SenseVoice-k?

Zenbat da SenseVoice?

Zenbat da SenseVoice modeloa?

Zenbat audio-formatu transkriba ditzake SenseVoicek?

SenseVoice-k hainbat hiztun detektatzen ditu?

Nire datuak pribatuak dira SenseVoice erabiltzen dudanean?

SenseVoice zenbakia SenseVoice serieko ordenagailuen modeloa da.

Erabili dezaket SenseVoice API bidez?

SenseVoice nire zerbitzarian exekutatu dezaket?