Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Cwestiynau a Ofynnir yn Aml
Model siarad-i-testun gan STT.ai yw STT.ai Enhanced. Mae STT.ai yn gwestiwn STT.ai Enhanced ar ein strwythur GPU felly gallwch ei ddefnyddio heb ddarparu eich caledwedd eich hun - lawrlwythwch sain neu fideo a dewiswch STT.ai Enhanced o'r dewisydd model.
Ar fesurau safonol, mae STT.ai Enhanced yn cyrraedd Cyfradd Gwallau Geiriau o tua 3.2%. Mae cywirdeb yn y byd go iawn yn dibynnu ar ansawdd sain, sain a iaith; ar gyfer recordiadau swnllyd neu sainedig, disgwyliwch ychydig o bwyntiau canran uwch WER.
Model premiwm yw STT.ai Enhanced — yn cynnwys unrhyw gynllun STT.ai wedi ei dalu yn dechrau ar $5/mis. Gall defnyddwyr am ddim rhagolwg STT.ai Enhanced ar clipiau byr; mae angen cynllun gweithredol ar ffeiliau hirach.
Darperir STT.ai Enhanced o dan Proprietary. Mae fersiwn gwesteiedig STT.ai yn trin y cydymffurfiaeth trwydded ar eich rhan, felly mae defnyddio masnachol drwy ein gwasanaeth yn syml.
Cynhelir STT.ai Enhanced iaith 100. Mae darganfod yn awtomatig yn dewis yr iaith gywir ar gyfer y rhan fwyaf o sain; gallwch hefyd ei benodi â llaw er mwyn gwella cywirdeb ychydig.
Mae STT.ai Enhanced yn prosesu sain ar tua 160.0x amser real ar ein GPUs. Mae ffeil sain 1 awr yn gorffen mewn llai na 1 munud; mae ffeiliau hirach yn rhedeg yn y rhes a chaiff eu hysbysu drwy e-bost pan fyddant wedi gorffen.
Mae gan STT.ai Enhanced baramedrau 1.5B. Mae modelau mwy yn tueddu i fod yn fwy cywir ond yn araf; mae STT.ai yn gwestiwn STT.ai Enhanced ar y GPU felly nid yw'r cyfrif paramedrau yn effeithio ar eich perfformiad ochr y cleient.
Mae STT.ai Enhanced yn derbyn pob fformat a gynhelir gan STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ac eraill. Allbwn fel TXT, SRT, VTT, DOCX, JSON, neu PDF.
Ie. Rheda diareiddio siaradwyr gyda STT.ai Enhanced ar gyfer pob trosysgrifiad - mae pob siaradwr yn cael ei labelu a gallwch eu hail-enwi yn y golygydd yna.
Ydy. Mae STT.ai Enhanced yn rhedeg yn ein strwythur preifat — mae sain yn cael ei brosesu a'i ddileu yn rhagosodedig. Mae Pro+ yn ychwanegu amgryptio ochr y cleient fel nad yw trosysgrifau'n darllenadwy heb eich allwedd, a'r Cwmwl Preifat yn gadael i chi hunan-hostio STT.ai Enhanced yn llwyr yn eich VPC eich hun.
Defnyddiwch yr erfyn compare-stt i redeg STT.ai Enhanced yn erbyn unrhyw ddull arall a gynhelir ar yr un sain — byddwch yn gweld WER, cyfrif segmentau, labeli siaradwyr, a sgôr ymddiriedaeth ochr yn ochr. Y cymhariaeth STT.ai Enhanced vs Whisper Large V3 yw'r un fwyaf cyffredin.
Ie. Penodi "stt-ai-enhanced" fel paramedr model ar y /v1/transcribe diwedd-bwynt. Mae Python a Node.js SDKs yn cynnwys enghreifftiau STT.ai Enhanced. Mae lefel API am ddim yn cynnwys 100 munud/mis.
Mae STT.ai yn gosod trwyddedu ar gyfer STT.ai Enhanced; mae hunan-gartrefu yn dibynnu ar eu telerau. Mae gwasanaeth cartrefu STT.ai yn rhedeg STT.ai Enhanced ar GPU rheoli felly nid oes angen i chi ymdrin â'r cydweithrediad hwn.