Ziņot par kļūdu / funkciju pieprasījumu

Atzīmēt ar SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Darbs ar publiski pieejamu audio un video. DRM aizsargāts saturs nav atbalstīts.

Uzlabot, lai uzlabotu

Privātais transkripts

Tērzēšana ar transkriptu

Atslēgt ar Pro →

Nomest failu šeit vai noklikšķiniet, lai pārlūkotu

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – līdz 2GB

Partijas augšupielāde vairākiem failiem ar Pro

Uzlabot, lai uzlabotu

Privātais transkripts

Tērzēšana ar transkriptu

Atslēgt ar Pro →

Uzlabot, lai uzlabotu

Reālā laika runa uz tekstu. AI auto-korekcija, kad jūs runājat — precizitāte uzlabojas ar ilgāku runu.

Vispirms pārbaudiet mikrofonu

10 bezmaksas min./dienā 600 min bez pierakstīšanās Nav kredītkartes Šifrēts

Pierakstīties bez maksas →

5.5%

WER

Valodas

50.0x

Ātrums

MIT

Licence

Par SenseVoice

SenseVoice ir runas pamata modelis no FunAudioLLM, kas sniedzas tālāk par transkripciju. Tas atbalsta 50+ valodas un ietver iespējas emocionālai atpazīšanai, audio notikumu atklāšanai un apgrieztā teksta normalizēšanai vienā modelī.

Valodas, kuras atbalsta SenseVoice

Angļu

Spāņu

Franču

Vācu

Ķīniešu

Japāņu

Korejiešu

Portugāļu

Arābu

Hindi

Krievu

Itāļu

Holandiešu

Turku

Poļu

Zviedru

Indonēziešu

Taju

Vjetnamiešu

Čehu

Grieķu

Rumāņu

Ungāru

Ivrits

Dāņu

Somu

Norvēģu

Ukraiņu

Malajiešu

Bengāļu

Modelis Info

PiegādātājsFunAudioLLM
Arhitektūra-
LicenceMIT
AtjaunotsMar 2026

Saistītie modeļi

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Bieži uzdoti jautājumi

SenseVoice ir runas-teksta modelis līdz FunAudioLLM. STT.ai uzstādā SenseVoice mūsu GPU infrastruktūrā, lai jūs varētu to izmantot, nenodrošinot savu aparatūru — augšupielādēt audio vai video un izvēlēties SenseVoice no modeļa izvēlētājs.

Par standarta etaloniem 8801% sasniedz aptuveni 8801% vārdu kļūdu rādītājs. Reālā pasaules precizitāte ir atkarīga no audio kvalitātes, akcenta un valodas; trokšņainiem vai izceltiem ierakstiem, sagaida dažus procentu punktus augstāka WER.

SenseVoice notiek uz STT.ai bezmaksas līmeni – katrs apmeklētājs saņem 600 minūtes, lai sāktu bez maksas. Maksājamie plāni pievienot ilgākus vienas datnes limitus, privātus transkriptus, un prioritātes rindas.

SenseVoice tiek izlaists zem MIT, atļautā atvērtā pirmkoda licence. Jūs varat paša-host SenseVoice uz savu aparatūru vai izmantot mūsu hostinga versiju — abi ir komerciāli izmantojami.

SenseVoice atbalsta 50 valodas. Auto-noteikšana izvēlas pareizo valodu lielākajai daļai audio; jūs varat arī norādīt to manuāli, lai mazs precizitātes pacēlājs.

SenseVoice apstrādā audio apmēram 50.0x reāllaikā mūsu GPU. 1 stundu audio fails beidzas zem 1 minūtēm; ilgāka failu rinda un paziņo pa e-pastu, kad izdarīts.

SenseVoice ir 234M parametri. Lielāki modeļi mēdz būt precīzāki, bet lēnāki; STT.ai saimnieki SenseVoice par GPU, tāpēc parametru skaits neietekmē jūsu klientu veiktspēju.

SenseVoice pieņem katru formātu STT.ai atbalsta - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI un citi. Izlaide kā TXT, SRT, VTT, DOCX, JSON, vai PDF.

Jā. Skaļruņa diarizācija notiek līdzās 88 000 par katru transkripciju — katrs runātājs ir marķēts un jūs varat pārdēvēt tos redaktorā pēc tam.

Jā. SenseVoice darbojas mūsu pārvaldītajā vidē — audio tiek apstrādāts un dzēsts pēc noklusējuma un nekad netiek izmantots apmācībai bez skaidra opt-in. Pro plāni pievienot klienta pusē šifrēšanu transkriptiem miera stāvoklī.

Izmantojiet salīdzināšanas-stt rīku, lai palaistu SenseVoice pret jebkuru citu atbalstīto modeli tajā pašā audio — jūs redzēsiet WER, segmentu skaitu, skaļruņu etiķetes un uzticamības punktus blakus-by-by. SenseVoice vs Whisper Lielo V3 salīdzinājums ir visbiežāk palaist.

Jā. Norādīt "sensevoice" kā modeļa parametru /v1/tractor galapunktā. Python un Node.js SDK ietver SenseVoice piemērus. Bezmaksas API līmenis ietver 100 minūtes/mēnesi.

Jā. Tā kā SenseVoice ir licences MIT, jūs varat paši-host to. STT.ai atvērtā pirmkoda lapā uzskaitīti projekta repo un svaru. Lielākā daļa ražošanas komandas izmanto mūsu hostinga versiju, lai izlaistu GPU iepirkumu, modeļu mijmaiņas darījumi, un opcijas.

Atzīmēt ar SenseVoice

Par SenseVoice

Valodas, kuras atbalsta SenseVoice

Modelis Info

Saistītie modeļi

Bieži uzdoti jautājumi

Kas ir SenseVoice?

Cik precīzi ir SenseVoice?

Vai ir SenseVoice brīvi izmantot?

Kādu licenci izmanto SenseVoice cilvēki?

Cik daudz valodu atbalsta SenseVoice?

Cik ātri ir SenseVoice?

Cik liels ir SenseVoice modelis?

Kādus audio formātus var pārrakstīt SenseVoice?

Vai SenseVoice konstatē vairākus runātājus?

Vai mani dati ir privāti, izmantojot SenseVoice?

Kā SenseVoice salīdzina ar citiem STT modeļiem?

Vai es varu izmantot SenseVoice, izmantojot API?

Vai es varu palaist SenseVoice uz sava servera?