Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Кайвакыт бирелә торган сораулар
Whisper Large V3 — OpenAI-нең сүздән-текстка модель. STT.ai безнең GPU инфраструктурасында урнашкан, шуңа күрә сез аны үз аппаратурагызны тәэмин итмичә куллана аласыз — аудио яки видеоны урнаштырыгыз һәм модель сайлап алучыдан Whisper Large V3-не сайлагыз.
Whisper Large V3 стандарт бәяләүләрдә сүз хаталары 4.2% тәшкил итә. Реаль дөньяда дөреслек аудио сыйфатына, акцентка һәм телгә бәйле; тавышлы яки акцентлы язу өчен, WER ны берничә процентка арттырырга мөмкин.
Whisper Large V3 STT.ai-нең бушлай дәрәҗәсендә эшли — һәрбер кунак 600 минут / ай бушлай ала. түләүле планнар файлга озынрак чикләүләр, шәхси транскрипцияләр һәм приоритетлы чиратлаштыру өсти.
Whisper Large V3 MIT лицензиясе нигезендә чыгарыла, ул ачык чыганак лицензиясе. Сез Whisper Large V3-не үз җайланмагызда урнаштыра аласыз яки безнең урнаштырылган версияне куллана аласыз — икесе дә коммерцияле куллануга яраклы.
Whisper Large V3 99 телне яклый. Аудио өчен дөрес телне автоматик ачыклау сайлый; аны үзегезгә туры китереп тә билгеләп була, тик бу дөреслекне бераз арттыра.
Whisper Large V3 безнең GPUларда 8.0x реаль вакыт белән аудио эшкәртә. 1 сәгатьлек аудио файл 7 минут эчендә тәмамлана; озынрак файллар чиратка куела һәм эш тәмамлангач электрон почта аша хәбәр ителә.
Whisper Large V3дә 1.55B параметрлары бар. Зуррак модельләр төгәлрәк, ләкин зәгыйфьрәк; STT.ai Whisper Large V3не график процессорда урнаштыра, шуңа күрә параметрлар саны клиент ягы эшчәнлегенә йогынты ясамый.
Whisper Large V3 STT.ai тарафыннан якланган һәр форматны кабул итә — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI һәм башкалар.
Whisper Large V3 сүзлекнең һәрберсе өчен сөйләүче диаризациясе эшли — һәр сөйләүчегә тамга куела һәм соңрак редакторда аларны исемнәре үзгәртелә.
Әйе. Whisper Large V3 безнең идарә ителгән тирәлектә эшли — аудио эшкәртелә һәм юкка чыгарыла һәм ачыктан-ачык кушылмаусыз өйрәтү өчен беркайчан да кулланылмый. Про планнары клиент тарафыннан шифрлауны ялгыз трактовкаларга өсти.
Whisper Large V3не башка башка ярдәм ителгән модельләр белән бер үк аудиода чагыштыру өчен compare-stt инструментын кулланыгыз — сез WER, сегментлар саны, тавыш язучылары һәм ышанычлылык күрсәткечләрен бер-бер артлы күрерсез. Whisper Large V3 һәм Whisper Large V3 чагыштыруы иң еш кулланыла.
Әйе. /v1/transcribe ахыргы ноктасында модель параметры буларак "whisper-large-v3"не күрсәтегез. Python һәм Node.js SDKлары Whisper Large V3 мисалын кертәләр. Бушлай API катламы айга 100 минутны тәшкил итә.
Әйе. Whisper Large V3 MIT-лицензияләнгән булганлыктан, сез аны үзегез урнаштыра аласыз. STT.ai'ның ачык чыганаклы битендә проектның репо һәм авырлыклары күрсәтелгән. Продукция төркемнәре безнең урнаштырылган версияне GPU сатып алу, модель алмашу һәм опсларны калдыру өчен кулланалар.