Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Саволҳои пурсидашуда
Whisper Large V3 - ин модел барои гуфтугӯ ба матн аз тарафи OpenAI мебошад. STT.ai Whisper Large V3- ро дар инфрасохтори GPU- и мо ҷойгир мекунад, бинобар ин шумо метавонед онро бе таъминоти худи дастгоҳ истифода баред - аудио ё видеоро бор кунед ва Whisper Large V3- ро аз интихобкунандаи модел интихоб кунед.
Дар стандартҳои стандартӣ, Whisper Large V3 ба 4.2% - и хатогии калима мерасад. Дақиқии воқеӣ аз сифати аудио, акцент ва забон вобаста аст; барои сабтҳои овозӣ ё акцентӣ, чанд фоизи баландтарро интизор шавед WER.
Whisper Large V3 дар сатҳи ройгони STT.ai кор мекунад — ҳар як меҳмон 600 дақиқа/моҳ бепул мегирад. Нақшаҳои пардохташуда лимити дарозтари файл, нусхаҳои махфии нусха ва навбати афзалиятнокро илова мекунанд.
Whisper Large V3 таҳти иҷозатномаи MIT, иҷозатномаи кушодаи сарчашмаҳои кушода нашр шудааст. Шумо метавонед Whisper Large V3- ро дар дастгоҳи худ ё дар версияи хостишудаи мо истифода баред - ҳардуи онҳо тиҷоратӣ истифодашавандаанд.
Whisper Large V3 99 забонҳоро дастгирӣ мекунад. Муайянкунии худкор барои бисёри аудиоҳо забони дурустро интихоб мекунад; шумо инчунин метавонед онро барои баланд бардоштани дақиқии хурд ба таври дастӣ муайян кунед.
Whisper Large V3 аудиоро дар вақти воқеӣ дар GPU-ҳои мо тақрибан 8.0x коркард мекунад. Файли аудиоии 1 соат дар муддати 7 дақиқа ба итмом мерасад; файлҳои дарозтар дар навбат меистанд ва ҳангоми анҷом ёфтан бо почтаи электронӣ огоҳ карда мешаванд.
Whisper Large V3 параметрҳои 1.55B дорад. Намунаҳои калонтар ба дақиқтарӣ ва сустӣ майл доранд; STT.ai Whisper Large V3-ро дар GPU ҷойгир мекунад, бинобар ин ҳисобкунии параметрҳо ба иҷроиши тарафи клиент таъсир намерасонад.
Whisper Large V3 ҳамаи форматҳои STT.ai-ро дастгирӣ мекунад — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ва дигарон. Хуруҷ ҳамчун TXT, SRT, VTT, DOCX, JSON ё PDF.
Да. Диаризатсияи сухангӯ барои ҳар як нусхаи Whisper Large V3 иҷро мешавад - ҳар як сухангӯ бо нишона нишон дода мешавад ва шумо метавонед онҳоро баъдтар дар муҳаррир номгузорӣ кунед.
Да. Whisper Large V3 дар муҳити идорашавандаи мо кор мекунад — аудио бо пешфарз коркард ва нест карда мешавад ва ҳеҷ гоҳ барои омӯзиш бе иҷозатномаи равшан истифода намешавад. Нақшаҳои Pro рамзгузории тарафҳои мизоҷон барои нусхаҳои хомӯшро илова мекунанд.
Барои иҷрои Whisper Large V3 дар муқоиса бо дигар моделҳои дастгиришаванда дар ҳамон аудио абзори compare-stt-ро истифода баред — шумо WER, шумори сегментҳо, нишонаҳои баландгӯяк ва натиҷаҳои боварӣ дар канори ҳам хоҳед дид. Муқоисаи Whisper Large V3 ва Whisper Large V3-ро аксар вақт иҷро мекунанд.
"whisper-large-v3"-ро ҳамчун параметри намуна дар нуқтаи охирини /v1/transcribe муайян кунед. Python ва Node.js SDK-ҳо мисолҳои Whisper Large V3-ро дар бар мегиранд. Сатҳи API-и ройгон 100 дақиқа/моҳро дар бар мегирад.
Бале. Азбаски Whisper Large V3 дорои иҷозатномаи MIT мебошад, шумо метавонед онро худи худ соҳиб шавед. Саҳифаи сарчашмаи кушодаи STT.ai репозитории лоиҳаро ва вазнҳоро дар бар мегирад. Бисёре аз дастаҳои истеҳсолот барои гузаронидани хариди GPU, ивазкунии намунаҳо ва амалиётҳо версияи соҳибшудаи моро истифода мебаранд.