Transcribe with Whisper Large V3

Virkar með almenningi tiltækum hljóð og myndskeið. DRM-varið efni er ekki stutt.

Uppfærsla fyrir Enhanced
Private transcript
Spjallaðu með afritun
Opna með Pro →
Slepptu skrá hér eða smelltu til að fletta
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - allt að 2GB
Uppfærsla fyrir Enhanced
Private transcript
Spjallaðu með afritun
Opna með Pro →
Uppfærsla fyrir Enhanced
Upptaka: 0:00
Rauntími Vax (stund)
Endurbætt Whisper (nákvæm)
Almennir tenglar: 24 klst, aðeins texti · Skráðu þig inn fyrir 7d + hljóð · Pro Leita að einkatenglum

AI leiðréttir sjálfkrafa þegar þú talar - nákvæmni bætir við lengri ræðu.

Prófaðu hljóðnemann fyrst
❤️ Elska STT.ai? Segðu vinum þínum!
Ūú hefur notað ókeypis afritunina þína

Skráðu þig ókeypis til að fá 600 mínútur / mánuð, eða uppfæra fyrir ótakmarkaða afritun.

10 ókeypis mín / dag 600 mín ókeypis með skráningu Engin kreditkort Dulritað
Skráðu þig ókeypis →
4.2%
WER
99
Languages
8.0x
Speed
MIT
License

About Whisper Large V3

Algengar spurningar

STT.ai hýsir Whisper Large V3 á GPU innviði okkar svo þú getur notað það án þess að útvega eigin vélbúnað - hlaða hljóð eða myndskeið og velja Whisper Large V3 frá líkan picker.

Á venjulegum viðmiðum nær Whisper Large V3 um 4.2% orðvillahlutfall. Nákvæmni í raunveruleikanum fer eftir hljóðgæðum, hreim og tungumáli. Fyrir háværar eða hreimlegar upptökur skal búast við nokkrum prósentustigum hærri WER.

Whisper Large V3 keyrir á ókeypis stigi STT.ai - hver gestur fær 600 mínútur / mánuð án kostnaðar.Greitt áætlanir bæta við lengri takmörkum á skrá, einka afritunar og forgangsröðun.

Whisper Large V3 er gefið út undir MIT, leyfilegt opið afnotaleyfi.Þú getur sjálf-hýsa Whisper Large V3 á eigin vélbúnaði eða nota hýsta útgáfu okkar - bæði eru nothæf í atvinnuskyni.

Whisper Large V3 styður 99 tungumál. Sjálfvirk greining velur rétt tungumál fyrir flest hljóð. Þú getur einnig tilgreint það handvirkt til að ná nákvæmni.

Whisper Large V3 vinnur hljóð á um 8.0x rauntíma á GPU okkar.1 klukkustund hljóðskrá lýkur í undir 7 mínútur; lengri skrár biðröð og tilkynna með tölvupósti þegar gert.

Stærri gerðir hafa tilhneigingu til að vera nákvæmari en hægari; STT.ai hýsir Whisper Large V3 á GPU þannig að fjöldi breytna hefur ekki áhrif á frammistöðu biðlara.

Whisper Large V3 samþykkir hvert snið STT.ai styður - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI og aðrir.Output sem TXT, SRT, VTT, DOCX, JSON, eða PDF.

Hátalari diarization keyrir ásamt Whisper Large V3 fyrir hverja uppskrift - hver hátalari er merkt og þú getur endurnefnt þá í ritlinum eftir það.

Já. Whisper Large V3 keyrir í stjórnað umhverfi okkar - hljóð er unnið og eytt sjálfgefið og aldrei notað til þjálfunar án þess að skýrt sé valið. Pro áætlanir bæta við dulkóðun á viðskiptavinarhlið fyrir afritunarefni í hvíld.

Notaðu samanburðar-stt tólið til að keyra Whisper Large V3 gegn öðrum studdum líkani á sama hljóðinu - þú munt sjá WER, hlutatölu, hátalaramerki og traust stig hlið við hlið.Whisper Large V3 vs Whisper Large V3 samanburður er algengasta hlaupið.

Já. Tilgreindu "whisper-large-v3" sem líkan viðfang á /v1/transcribe endapunkti. Python og Node.js SDK innihalda Whisper Large V3 dæmi. Ókeypis API tier inniheldur 100 mínútur / mánuð.

Já. Vegna þess að Whisper Large V3 er MIT-leyfi, getur þú sjálfur hýst það. STT.ai's opinn uppspretta síðu sýnir verkefnið repo og þyngd. Flestir framleiðsluteymi nota hýsta útgáfu okkar til að sleppa GPU innkaupum, líkanskiptum og aðgerðum.