Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Жиі қойылатын сұрақтар
Whisper Large V3 - OpenAI- нің сөйлеуден мәтінге аудару үлгісі. STT.ai- дің Whisper Large V3- ді графикалық процессордың инфрақұрылымы қолдайды, сондықтан оны өзіңіздің жабдықтарыңызды қоспай- ақ қолдана аласыз - аудио не видеоны жүктеп, үлгіні таңдау құралынан Whisper Large V3- ді таңдаңыз.
Стандартты тексерулерде Whisper Large V3 шамамен 4.2% сөз қателігіне ие. Тілдегі қателіктердің шынайы дәлдігі дыбыс сапасына, акцентіне және тіліне байланысты; шулы немесе акцентті жазбалар үшін WER бірнеше пайызға жоғары болады.
Whisper Large V3 STT.ai-ның тегін деңгейінде жұмыс істейді — әрбір келуші айына 600 минутты тегін алады. Ақылы жоспарлар файлға қысқа шектеулер, жеке транскрипциялар және артықшылық кезекті қосады.
Whisper Large V3 MIT ашық-көздік лицензиясымен шығарылған. Сіз Whisper Large V3-ді өзіңіздің жабдықтарыңызда немесе біздің хостинг нұсқамызды қолданып, өзіңізде орната аласыз - екеуі де коммерциялық мақсатта қолданылады.
Whisper Large V3 99 тілдерді қолдайды. Аудио файлдардың көпшілігі үшін тіл автоматты түрде анықталады; бірақ, дәлдігін арттыру үшін оны қолмен де келтіруге болады.
Whisper Large V3 аудионы біздің графикалық процессорларда 8.0x жылдамдықпен өңдейді. 1 сағаттық аудио файлды өңдеу 7 минуттан аз уақытты алады; ұзақ файлдар кезекке тұрып, орындалғанда эл. пошта арқылы хабарланады.
Whisper Large V3- нің 1.55B параметрлері бар. Үлкен модельдер нақтылығы жоғары, бірақ баяу; STT.ai- дің графикалық процессорында Whisper Large V3 бар, сондықтан параметрлер саны клиенттік жағының жылдамдығына әсер етпейді.
Whisper Large V3 STT.ai қолдайтын барлық пішімдерді қабылдайды — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI және басқалары. Шығыс TXT, SRT, VTT, DOCX, JSON немесе PDF.
Иә. Дикторлар тізімі әрбір транскрипция үшін Whisper Large V3- мен бірге орындалады - әрбір дыбыс шығарушы белгіленеді, содан кейін редакторда қайта атауға болады.
Иә. Whisper Large V3 біздің басқару ортамызда орындалады — аудио әдетті түрде өңделеді және өшіріледі, және ешқашан да рұқсатсыз оқыту үшін қолданылмайды. Pro жоспары клиенттік тараптан тыныштықтағы транскрипттерді шифрлауды қосады.
compare-stt құралын пайдаланып, Whisper Large V3-ді басқа қолдау көрсетілетін модельдермен салыстырып көріңіз. WER, сегменттер саны, динамиктердің жарлықтары және сенімділік көрсеткіштері қатар көрсетіледі. Whisper Large V3 мен Whisper Large V3 салыстыруы жиі қолданылады.
Иә. /v1/transcribe аяқтау нүктесіндегі модель параметрі ретінде "whisper-large-v3" дегенді келтіріңіз. Python және Node.js SDK- лары Whisper Large V3 мысалдарды қамтиды. API- ның тегін деңгейі 100 минут/ ай.
Иә. Whisper Large V3 MIT лицензиясымен шыққандықтан, оны өзіңіз хост ете аласыз. STT.ai ашық көздер бетінде жобаның репозиториясы мен салмағы көрсетілген. Өндірістік топтардың көбі біздің хост нұсқамызды GPU сатып алу, модельдерді алмастыру және операцияларды өткізіп жіберу үшін пайдаланады.