Transcribe with Whisper Turbo
5.1%
WER
99
Languages
32.0x
Speed
MIT
License
About Whisper Turbo
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Саволҳои пурсидашуда
Whisper Turbo - ин модел барои гуфтугӯ ба матн аз тарафи OpenAI мебошад. STT.ai Whisper Turbo- ро дар инфрасохтори GPU- и мо ҷойгир мекунад, бинобар ин шумо метавонед онро бе таъминоти худи дастгоҳ истифода баред - аудио ё видеоро бор кунед ва Whisper Turbo- ро аз интихобкунандаи модел интихоб кунед.
Дар стандартҳои стандартӣ, Whisper Turbo ба 5.1% - и хатогии калима мерасад. Дақиқии воқеӣ аз сифати аудио, акцент ва забон вобаста аст; барои сабтҳои овозӣ ё акцентӣ, чанд фоизи баландтарро интизор шавед WER.
Whisper Turbo дар сатҳи ройгони STT.ai кор мекунад — ҳар як меҳмон 600 дақиқа/моҳ бепул мегирад. Нақшаҳои пардохташуда лимити дарозтари файл, нусхаҳои махфии нусха ва навбати афзалиятнокро илова мекунанд.
Whisper Turbo таҳти иҷозатномаи MIT, иҷозатномаи кушодаи сарчашмаҳои кушода нашр шудааст. Шумо метавонед Whisper Turbo- ро дар дастгоҳи худ ё дар версияи хостишудаи мо истифода баред - ҳардуи онҳо тиҷоратӣ истифодашавандаанд.
Whisper Turbo 99 забонҳоро дастгирӣ мекунад. Муайянкунии худкор барои бисёри аудиоҳо забони дурустро интихоб мекунад; шумо инчунин метавонед онро барои баланд бардоштани дақиқии хурд ба таври дастӣ муайян кунед.
Whisper Turbo аудиоро дар вақти воқеӣ дар GPU-ҳои мо тақрибан 32.0x коркард мекунад. Файли аудиоии 1 соат дар муддати 1 дақиқа ба итмом мерасад; файлҳои дарозтар дар навбат меистанд ва ҳангоми анҷом ёфтан бо почтаи электронӣ огоҳ карда мешаванд.
Whisper Turbo параметрҳои 809M дорад. Намунаҳои калонтар ба дақиқтарӣ ва сустӣ майл доранд; STT.ai Whisper Turbo-ро дар GPU ҷойгир мекунад, бинобар ин ҳисобкунии параметрҳо ба иҷроиши тарафи клиент таъсир намерасонад.
Whisper Turbo ҳамаи форматҳои STT.ai-ро дастгирӣ мекунад — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ва дигарон. Хуруҷ ҳамчун TXT, SRT, VTT, DOCX, JSON ё PDF.
Да. Диаризатсияи сухангӯ барои ҳар як нусхаи Whisper Turbo иҷро мешавад - ҳар як сухангӯ бо нишона нишон дода мешавад ва шумо метавонед онҳоро баъдтар дар муҳаррир номгузорӣ кунед.
Да. Whisper Turbo дар муҳити идорашавандаи мо кор мекунад — аудио бо пешфарз коркард ва нест карда мешавад ва ҳеҷ гоҳ барои омӯзиш бе иҷозатномаи равшан истифода намешавад. Нақшаҳои Pro рамзгузории тарафҳои мизоҷон барои нусхаҳои хомӯшро илова мекунанд.
Барои иҷрои Whisper Turbo дар муқоиса бо дигар моделҳои дастгиришаванда дар ҳамон аудио абзори compare-stt-ро истифода баред — шумо WER, шумори сегментҳо, нишонаҳои баландгӯяк ва натиҷаҳои боварӣ дар канори ҳам хоҳед дид. Муқоисаи Whisper Turbo ва Whisper Large V3-ро аксар вақт иҷро мекунанд.
"whisper-turbo"-ро ҳамчун параметри намуна дар нуқтаи охирини /v1/transcribe муайян кунед. Python ва Node.js SDK-ҳо мисолҳои Whisper Turbo-ро дар бар мегиранд. Сатҳи API-и ройгон 100 дақиқа/моҳро дар бар мегирад.
Бале. Азбаски Whisper Turbo дорои иҷозатномаи MIT мебошад, шумо метавонед онро худи худ соҳиб шавед. Саҳифаи сарчашмаи кушодаи STT.ai репозитории лоиҳаро ва вазнҳоро дар бар мегирад. Бисёре аз дастаҳои истеҳсолот барои гузаронидани хариди GPU, ивазкунии намунаҳо ва амалиётҳо версияи соҳибшудаи моро истифода мебаранд.