Transcribe with SenseVoice

Virkar með almenningi tiltækum hljóð og myndskeið. DRM-varið efni er ekki stutt.

Uppfærsla fyrir Enhanced
Private transcript
Spjallaðu með afritun
Opna með Pro →
Slepptu skrá hér eða smelltu til að fletta
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - allt að 2GB
Uppfærsla fyrir Enhanced
Private transcript
Spjallaðu með afritun
Opna með Pro →
Uppfærsla fyrir Enhanced
Upptaka: 0:00
Rauntími Vax (stund)
Endurbætt Whisper (nákvæm)
Almennir tenglar: 24 klst, aðeins texti · Skráðu þig inn fyrir 7d + hljóð · Pro Leita að einkatenglum

AI leiðréttir sjálfkrafa þegar þú talar - nákvæmni bætir við lengri ræðu.

Prófaðu hljóðnemann fyrst
❤️ Elska STT.ai? Segðu vinum þínum!
Ūú hefur notað ókeypis afritunina þína

Skráðu þig ókeypis til að fá 600 mínútur / mánuð, eða uppfæra fyrir ótakmarkaða afritun.

10 ókeypis mín / dag 600 mín ókeypis með skráningu Engin kreditkort Dulritað
Skráðu þig ókeypis →
5.5%
WER
50
Languages
50.0x
Speed
MIT
License

About SenseVoice

Algengar spurningar

STT.ai hýsir SenseVoice á GPU innviði okkar svo þú getur notað það án þess að útvega eigin vélbúnað - hlaða hljóð eða myndskeið og velja SenseVoice frá líkan picker.

Á venjulegum viðmiðum nær SenseVoice um 5.5% orðvillahlutfall. Nákvæmni í raunveruleikanum fer eftir hljóðgæðum, hreim og tungumáli. Fyrir háværar eða hreimlegar upptökur skal búast við nokkrum prósentustigum hærri WER.

SenseVoice keyrir á ókeypis stigi STT.ai - hver gestur fær 600 mínútur / mánuð án kostnaðar.Greitt áætlanir bæta við lengri takmörkum á skrá, einka afritunar og forgangsröðun.

SenseVoice er gefið út undir MIT, leyfilegt opið afnotaleyfi.Þú getur sjálf-hýsa SenseVoice á eigin vélbúnaði eða nota hýsta útgáfu okkar - bæði eru nothæf í atvinnuskyni.

SenseVoice styður 50 tungumál. Sjálfvirk greining velur rétt tungumál fyrir flest hljóð. Þú getur einnig tilgreint það handvirkt til að ná nákvæmni.

SenseVoice vinnur hljóð á um 50.0x rauntíma á GPU okkar.1 klukkustund hljóðskrá lýkur í undir 1 mínútur; lengri skrár biðröð og tilkynna með tölvupósti þegar gert.

Stærri gerðir hafa tilhneigingu til að vera nákvæmari en hægari; STT.ai hýsir SenseVoice á GPU þannig að fjöldi breytna hefur ekki áhrif á frammistöðu biðlara.

SenseVoice samþykkir hvert snið STT.ai styður - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI og aðrir.Output sem TXT, SRT, VTT, DOCX, JSON, eða PDF.

Hátalari diarization keyrir ásamt SenseVoice fyrir hverja uppskrift - hver hátalari er merkt og þú getur endurnefnt þá í ritlinum eftir það.

Já. SenseVoice keyrir í stjórnað umhverfi okkar - hljóð er unnið og eytt sjálfgefið og aldrei notað til þjálfunar án þess að skýrt sé valið. Pro áætlanir bæta við dulkóðun á viðskiptavinarhlið fyrir afritunarefni í hvíld.

Notaðu samanburðar-stt tólið til að keyra SenseVoice gegn öðrum studdum líkani á sama hljóðinu - þú munt sjá WER, hlutatölu, hátalaramerki og traust stig hlið við hlið.SenseVoice vs Whisper Large V3 samanburður er algengasta hlaupið.

Já. Tilgreindu "sensevoice" sem líkan viðfang á /v1/transcribe endapunkti. Python og Node.js SDK innihalda SenseVoice dæmi. Ókeypis API tier inniheldur 100 mínútur / mánuð.

Já. Vegna þess að SenseVoice er MIT-leyfi, getur þú sjálfur hýst það. STT.ai's opinn uppspretta síðu sýnir verkefnið repo og þyngd. Flestir framleiðsluteymi nota hýsta útgáfu okkar til að sleppa GPU innkaupum, líkanskiptum og aðgerðum.