Transcribe with SenseVoice

Deluje z javno dostopno avdio & video. Vsebnost, zaščitena z DRM, ni podprta.

Nadgradnja za izboljšano
Private transcript
Klepetaj s prepisom
Odkleni z Pro →
Izpusti datoteko ali klikni za brskanje
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – do 2GB
Nadgradnja za izboljšano
Private transcript
Klepetaj s prepisom
Odkleni z Pro →
Nadgradnja za izboljšano
Snemanje: 0:00
Realnočasovno Vosk (instant)
Izboljšano Šapetanje (natančno)
Javne povezave: 24h, samo besedilo · Vpišite se. za 7d + zvok · Prof. za zasebne povezave

Govor v realnem času na besedilo. AI avto-popravki, ko govorite – natančnost se izboljša z daljšim govorom.

Najprej preizkusite mikrofon.
❤️ Ljubezen STT.ai, povej prijateljem!
Uporabili ste svoje brezplačne transkripcije.

Prijavite se brezplačno, da dobite 600 minut/mesec, ali nadgradnjo za neomejene transkripcije.

10 brezplačnih min/dan 600 min brez prijave Brez kreditne kartice Šifrirano
Vpišite se brezplačno →
5.5%
WER
50
Languages
50.0x
Speed
MIT
License

About SenseVoice

Pogosta vprašanja

SenseVoice je model govora v tekst z FunAudioLLM. STT.ai gostiteljev SenseVoice na naši infrastrukturi GPU, tako da ga lahko uporabite, ne da bi zagotovili svojo lastno strojno opremo – naložite zvok ali video in izberite SenseVoice iz izbirnika modela.

Na standardnih merilih dosega SenseVoice približno 5.5% Word Napaka. Resnična natančnost je odvisna od kakovosti zvoka, naglasa in jezika; za glasne ali naglašene posnetke, pričakujemo nekaj odstotnih točk višje WER.

SenseVoice teče na brezplačni stopnji STT.ai – vsak obiskovalec dobi 600 minut/mesečno brez stroškov. Plačani načrti dodajajo več mejnih vrednosti za datoteko, zasebne transkripte in prednostne redke.

SenseVoice je sproščeno pod MIT, popustljivo dovoljenje odprtega izvora. Lahko samostojno gostite SenseVoice na lastni strojnici ali uporabite našo gostiteljsko različico – oba sta komercialno uporabna.

SenseVoice podpira 50 jezikov. Samodejno odkrivanje izbere pravi jezik za večino avdio; lahko ga tudi ročno navedete za majhno natančnost dvigala.

SenseVoice procesov avdio ob približno 50.0x v realnem času na naši GPU. 1 urni zvočni datoteka konča v manj kot 8802 minut; daljši datoteki v vrstici in obveščanje po e-pošti, ko se opravi.

SenseVoice ima STT.ai2 parametrov. Večji modeli so običajno bolj natančni, vendar počasnejši; STT.ai gostiteljev SenseVoice na GPU, tako da število parametrov ne vpliva na učinkovitost vašega stranke.

SenseVoice sprejema vse oblike STT.ai podpor – MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI in drugi. Izhod kot TXT, SRT, VTT, DOCX, JSON ali PDF.

Ja. Zvočniška diarizacija teče skupaj z SenseVoice za vsako transkripcijo – vsak zvočnik je označen in jih lahko kasneje preimenujete v uredniku.

Da. SenseVoice teče v našem upravljanem okolju – zvok se obdeluje in briše privzeto in nikoli ne uporablja za usposabljanje brez izrecne opt-in. Pro načrti dodati stran stranke šifriranje za transkripte v počitek.

Uporabite orodje primerjave-st, da teče SenseVoice proti kateremu koli drugemu podprti model na istem zvoku – boste videli WER, segment število, zvočnike, in samozavestne rezultate stran ob strani. Primerjava SenseVoice vs Whisper Large V3 je najpogostejši zagon.

Da. Navedite "sensevoice" kot parametr modela na /v1/transcribe end. Python in Node.js SDKs vključujejo SenseVoice primerov. Brezplačni API stopnja vključuje 100 minut/mesec.

Da. Ker je SenseVoice MIT-licenzirano, ga lahko samostojno gostite. STT.ai odprtih strani na seznamu projekta repo in uteži. Večina proizvodnih ekip uporablja našo gostiteljsko različico za preskočitev naročanja GPU, modeli zamenjave in ops.