Transcribe with Whisper Large V3

Аудио және бейне файлдармен жұмыс істейді. DRM-мен қорғалған мазмұн қолдау таппайды.

Жаңарту
Private transcript
Транскрипциямен әңгімелесу
Pro- мен бұғатты шешу →
Файлды осында сүйреп апарыңыз не шолуға түртіңіз
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2 Гб- қа дейін
Жаңарту
Private transcript
Транскрипциямен әңгімелесу
Pro- мен бұғатты шешу →
Жаңарту
Жазба: 0:00
Реал уақыт Қайталау (бір минут)
Жабдықталған Шыбырлау (тұрақты)
Ашық сілтемелер: 24h, тек мәтін · Жазылу 7d + аудио үшін · Про жеке сілтемелер үшін

Тікелей сөйлеуден мәтінге. ДК сөйлеген сайын автоматты түрде түзейді - сөйлеу ұзақ болған сайын дәлдігі артады.

Алдымен микрофонды тексеріңіз
❤️ STT.ai-ды ұнатасыз ба? Достарыңызға хабарлаңыз!
Сіз бос транскрипцияларды пайдаландыңыз

600 минут/ай үшін тегін тіркеліңіз, немесе шексіз транскрипциялар үшін жаңартыңыз.

10 бос минут/ күн 600 минут тегін тіркелу Кредиттік карта жоқ Шифрланған
Тегін тіркеліңіз →
4.2%
WER
99
Languages
8.0x
Speed
MIT
License

About Whisper Large V3

Жиі қойылатын сұрақтар

Whisper Large V3 - OpenAI- нің сөйлеуден мәтінге аудару үлгісі. STT.ai- дің Whisper Large V3- ді графикалық процессордың инфрақұрылымы қолдайды, сондықтан оны өзіңіздің жабдықтарыңызды қоспай- ақ қолдана аласыз - аудио не видеоны жүктеп, үлгіні таңдау құралынан Whisper Large V3- ді таңдаңыз.

Стандартты тексерулерде Whisper Large V3 шамамен 4.2% сөз қателігіне ие. Тілдегі қателіктердің шынайы дәлдігі дыбыс сапасына, акцентіне және тіліне байланысты; шулы немесе акцентті жазбалар үшін WER бірнеше пайызға жоғары болады.

Whisper Large V3 STT.ai-ның тегін деңгейінде жұмыс істейді — әрбір келуші айына 600 минутты тегін алады. Ақылы жоспарлар файлға қысқа шектеулер, жеке транскрипциялар және артықшылық кезекті қосады.

Whisper Large V3 MIT ашық-көздік лицензиясымен шығарылған. Сіз Whisper Large V3-ді өзіңіздің жабдықтарыңызда немесе біздің хостинг нұсқамызды қолданып, өзіңізде орната аласыз - екеуі де коммерциялық мақсатта қолданылады.

Whisper Large V3 99 тілдерді қолдайды. Аудио файлдардың көпшілігі үшін тіл автоматты түрде анықталады; бірақ, дәлдігін арттыру үшін оны қолмен де келтіруге болады.

Whisper Large V3 аудионы біздің графикалық процессорларда 8.0x жылдамдықпен өңдейді. 1 сағаттық аудио файлды өңдеу 7 минуттан аз уақытты алады; ұзақ файлдар кезекке тұрып, орындалғанда эл. пошта арқылы хабарланады.

Whisper Large V3- нің 1.55B параметрлері бар. Үлкен модельдер нақтылығы жоғары, бірақ баяу; STT.ai- дің графикалық процессорында Whisper Large V3 бар, сондықтан параметрлер саны клиенттік жағының жылдамдығына әсер етпейді.

Whisper Large V3 STT.ai қолдайтын барлық пішімдерді қабылдайды — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI және басқалары. Шығыс TXT, SRT, VTT, DOCX, JSON немесе PDF.

Иә. Дикторлар тізімі әрбір транскрипция үшін Whisper Large V3- мен бірге орындалады - әрбір дыбыс шығарушы белгіленеді, содан кейін редакторда қайта атауға болады.

Иә. Whisper Large V3 біздің басқару ортамызда орындалады — аудио әдетті түрде өңделеді және өшіріледі, және ешқашан да рұқсатсыз оқыту үшін қолданылмайды. Pro жоспары клиенттік тараптан тыныштықтағы транскрипттерді шифрлауды қосады.

compare-stt құралын пайдаланып, Whisper Large V3-ді басқа қолдау көрсетілетін модельдермен салыстырып көріңіз. WER, сегменттер саны, динамиктердің жарлықтары және сенімділік көрсеткіштері қатар көрсетіледі. Whisper Large V3 мен Whisper Large V3 салыстыруы жиі қолданылады.

Иә. /v1/transcribe аяқтау нүктесіндегі модель параметрі ретінде "whisper-large-v3" дегенді келтіріңіз. Python және Node.js SDK- лары Whisper Large V3 мысалдарды қамтиды. API- ның тегін деңгейі 100 минут/ ай.

Иә. Whisper Large V3 MIT лицензиясымен шыққандықтан, оны өзіңіз хост ете аласыз. STT.ai ашық көздер бетінде жобаның репозиториясы мен салмағы көрсетілген. Өндірістік топтардың көбі біздің хост нұсқамызды GPU сатып алу, модельдерді алмастыру және операцияларды өткізіп жіберу үшін пайдаланады.