Rapporter feil/ funksjonsforespørsel

Transkriber med SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Arbeider med offentlig tilgjengelig lyd og video. DRM- beskyttet innhold er ikke støttet.

Oppgradering for forbedret

Privat utskrift

Chat med utskrift

Lås opp med Pro →

Slipp fil her eller trykk for å bla gjennom

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — opptil 2GB

Last opp flere filer (flerbildeverktøy) med Pro

Oppgradering for forbedret

Privat utskrift

Chat med utskrift

Lås opp med Pro →

Oppgradering for forbedret

Sanntidstale til tekst. AI korrigerer automatisk mens du snakker – nøyaktighet forbedres med lengre tale.

Test mikrofonen din først

10 gratis min/dag 600 min fri med registrering Intet kredittkort Kryptert

Registrer deg gratis →

5.5%

WER

Språk

50.0x

Hastighet

MIT

Lisens

Om SenseVoice

SenseVoice er en tale- foundation- modell fra FunAudioLLM som går utover transkription. Det støtter 50+ språk og har muligheter til å gjenkjenne følelser, oppdage hendelser og normalisere omvendt tekst i en enkelt modell.

Språk støttet av SenseVoice

Engelsk

Spansk

Fransk

Tysk

Kinesisk

Japansk

Koreansk

Portugisisk

Arabisk

Hindi

Russisk

Italiensk

Nederlandsk

Tyrkisk

Polsk

Svensk

Indonesisk

Thai

Vietnamesisk

Tsjekkisk

Gresk

Rumensk

Ungarsk

Hebraisk

Dansk

Finsk

Norsk

Ukrainsk

Malayisk

Bengali

Modellinfo

LeverandørFunAudioLLM
Arkitektur-
LisensMIT
OppdatertMar 2026

Tilknyttede modeller

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Ofte stilte spørsmål

SenseVoice er en tale-til-tekst-modell av FunAudioLLM. STT.ai er verter SenseVoice på vår GPU-infrastruktur slik at du kan bruke den uten å skaffe til veie din egen maskinvare – last opp lyd eller video og velg SenseVoice fra modellvelgeren.

Med standard standardverdier oppnår 88 000 omtrent 5.5% ordfeilrate. Nøyaktighet i den virkelige verden avhenger av lydkvalitet, aksent og språk. For opptak med støy eller aksent, forvent noen prosentpoeng høyere WER.

SenseVoice kjører på STT.ais ledig nivå – hver besøkende får 600 minutter til å starte uten kostnad. Betalingsplaner legger til lengre filgrenser, private utskrifter og prioritetskøing.

SenseVoice er frigitt under MIT, en ettergivende åpen kildekode- lisens. Du kan selv være vert SenseVoice på din egen maskinvare eller bruke vår vertsversjon – begge kan brukes kommersielt.

SenseVoice støtter 50 språk. Auto- deteksjon velger det riktige språket for de fleste lydene. Du kan også oppgi det manuelt for en liten presisjonsheis.

SenseVoice behandler lyd ved omlag 50.0x i sanntid på våre GPU- er. En en- times lydfil er ferdig på under 1 minutter, lengre filkø og varsles med e- post når den er ferdig.

SenseVoice har 234M parametre. Større modeller har en tendens til å være mer presise men langsommere. STT.ai er verter SenseVoice på GPU så parametertallet påvirker ikke din ytelse på klientsiden.

SenseVoice godtar alle format STT.ai støtter – MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI og andre. Utdata som TXT, SRT, VTT, DOCX, JSON eller PDF.

Ja. Høytalerdiarisering går sammen med SenseVoice for hver utskrift – hver høyttaler er merket og du kan endre navn på dem i redigeringen etterpå.

Ja. SenseVoice kjører i vårt styrte miljø – lyd behandles og slettes som standard og brukes aldri til trening uten eksplisitt valg. Pro planer legger til kryptering på klientsiden for utskrifter i hvile.

Bruk sammenlikningsverktøyet til å kjøre SenseVoice mot alle andre modeller som støttes på samme lyd – du får se WER, segmenttelling, høyttal og tillitspoeng side om side. Sammenlikningen SenseVoice mot Whisper Stor V3 er det vanligste kjøreverktøyet.

Ja. Oppgi « sensevoice » som modellparameter for sluttpunktet / v1/ trancribe. Python og Node. js SDK inkluderer SenseVoice eksempler. Free API- nivå inkluderer 100 minutter/ måned.

Ja, fordi SenseVoice er MIT-lisensert, kan du selv være vert for det. STT.ai-tallets åpen-kildekode side lister prosjektet repo og vekter. de fleste produksjonsteam bruker vår vertsversjon til å hoppe over GPU innkjøp, modellbytteavtaler og ops.

Transkriber med SenseVoice

Om SenseVoice

Språk støttet av SenseVoice

Modellinfo

Tilknyttede modeller

Ofte stilte spørsmål

Hva er SenseVoice?

Hvor nøyaktig er SenseVoice?

Er SenseVoice gratis å bruke?

Hvilket førerkort bruker SenseVoice?

Hvor mange språk støtter SenseVoice?

Hvor fort er SenseVoice?

Hvor stor er SenseVoice-modellen?

Hvilke lydformater kan SenseVoice transskribere?

Finner SenseVoice flere høyttalere?

Er mine data private når de bruker SenseVoice?

Hvordan sammenlignes 88 000 med andre STT-modeller?

Kan jeg bruke SenseVoice via API?

Kan jeg kjøre SenseVoice på min egen tjener?