Transcribe with Whisper Large V3

Gweithio gyda sain a fideo sydd ar gael yn gyhoeddus. Ni chynhelir cynnwys sydd wedi'i amddiffyn gan DRM.

Uwchraddio i Gyflym
Private transcript
Sgwrsio gyda throsglwyddiad
Datgloi gyda Pro →
Rholio ffeil yma neu glicio i bori
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - hyd at 2GB
Uwchraddio i Gyflym
Private transcript
Sgwrsio gyda throsglwyddiad
Datgloi gyda Pro →
Uwchraddio i Gyflym
Recordio: 0:00
Amser real Cerrig (amserol)
Uwch Chwiban (cyson)
Cyswllt cyhoeddus: 24 awr, testun yn unig · Cofrestru ar gyfer 7d + sain · Proffesiynol am gysylltiadau preifat

Llythrennedd amser real i destun. Mae AI yn cywiro'n awtomatig wrth i chi siarad - mae cywirdeb yn gwella gyda llais hirach.

Arbrofi eich meicroffon yn gyntaf
❤️ Hoffwch STT.ai? Meddwl am eich ffrindiau!
Rydych wedi defnyddio eich trosysgrifiadau am ddim

Cofrestru am ddim i gael 600 munud/mis, neu uwchraddio am drosysgrifiadau diderfyn.

10 munud rhydd/diwrnod 600 munud am ddim gyda chofrestru Dim cerdyn credyd Wedi' i amgryptio
Cofrestru am ddim →
4.2%
WER
99
Languages
8.0x
Speed
MIT
License

About Whisper Large V3

Cwestiynau a Ofynnir yn Aml

Model siarad-i-testun gan OpenAI yw Whisper Large V3. Mae STT.ai yn gwestiwn Whisper Large V3 ar ein strwythur GPU felly gallwch ei ddefnyddio heb ddarparu eich caledwedd eich hun - lawrlwythwch sain neu fideo a dewiswch Whisper Large V3 o'r dewisydd model.

Ar fesurau safonol, mae Whisper Large V3 yn cyrraedd Cyfradd Gwallau Geiriau o tua 4.2%. Mae cywirdeb yn y byd go iawn yn dibynnu ar ansawdd sain, sain a iaith; ar gyfer recordiadau swnllyd neu sainedig, disgwyliwch ychydig o bwyntiau canran uwch WER.

Mae Whisper Large V3 yn rhedeg ar lefel rhad ac am ddim STT.ai — mae pob ymwelydd yn cael 600 munud/mis am ddim. Mae cynlluniau talu yn ychwanegu terfynau mwy hir ar gyfer pob ffeil, trosysgrifau preifat, a rhedeg mewn rhes flaenoriaeth.

Cyhoeddir Whisper Large V3 o dan MIT, trwydded ffynhonnell agored ganiataol. Gallwch hunan-gartrefu Whisper Large V3 ar eich caledwedd eich hun neu ddefnyddio ein fersiwn cartrefiedig — mae'r ddau yn defnyddiol yn fasnachol.

Cynhelir Whisper Large V3 iaith 99. Mae darganfod yn awtomatig yn dewis yr iaith gywir ar gyfer y rhan fwyaf o sain; gallwch hefyd ei benodi â llaw er mwyn gwella cywirdeb ychydig.

Mae Whisper Large V3 yn prosesu sain ar tua 8.0x amser real ar ein GPUs. Mae ffeil sain 1 awr yn gorffen mewn llai na 7 munud; mae ffeiliau hirach yn rhedeg yn y rhes a chaiff eu hysbysu drwy e-bost pan fyddant wedi gorffen.

Mae gan Whisper Large V3 baramedrau 1.55B. Mae modelau mwy yn tueddu i fod yn fwy cywir ond yn araf; mae STT.ai yn gwestiwn Whisper Large V3 ar y GPU felly nid yw'r cyfrif paramedrau yn effeithio ar eich perfformiad ochr y cleient.

Mae Whisper Large V3 yn derbyn pob fformat a gynhelir gan STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ac eraill. Allbwn fel TXT, SRT, VTT, DOCX, JSON, neu PDF.

Ie. Rheda diareiddio siaradwyr gyda Whisper Large V3 ar gyfer pob trosysgrifiad - mae pob siaradwr yn cael ei labelu a gallwch eu hail-enwi yn y golygydd yna.

Ydy. Mae Whisper Large V3 yn rhedeg yn ein hamgylchedd rheoli — mae sain yn cael ei brosesu a'i ddileu yn rhagosodedig ac ni chaiff ei ddefnyddio erioed ar gyfer hyfforddiant heb optio i mewn yn glir. Mae cynlluniau Pro yn ychwanegu amgryptio ochr y cleient ar gyfer trosysgrifau wrth aros.

Defnyddiwch yr erfyn compare-stt i redeg Whisper Large V3 yn erbyn unrhyw ddull arall a gynhelir ar yr un sain — byddwch yn gweld WER, cyfrif segmentau, labeli siaradwyr, a sgôr ymddiriedaeth ochr yn ochr. Y cymhariaeth Whisper Large V3 vs Whisper Large V3 yw'r un fwyaf cyffredin.

Ie. Penodi "whisper-large-v3" fel paramedr model ar y /v1/transcribe diwedd-bwynt. Mae Python a Node.js SDKs yn cynnwys enghreifftiau Whisper Large V3. Mae lefel API am ddim yn cynnwys 100 munud/mis.

Ie. Gan fod Whisper Large V3 yn cael ei drwyddedu gan MIT, gallwch ei hunan-gartrefu. Mae tudalen ffynhonnell agored STT.ai yn rhestru'r storfa a'r pwysau. Mae'r rhan fwyaf o'r timau cynhyrchu yn defnyddio ein fersiwn cartrefi i hepgor prynu GPU, cyfnewid modelau, ac ops.