Transcribe with Whisper Turbo

Працуе з публічна даступнымі аўдыё і відэа. Змест, абаронены DRM, не падтрымліваецца.

Абнавіць для пашыраных
Private transcript
Чат з транскрыптам
Разблакаваць з Pro →
Перамясціце файл сюды або націсніце, каб прагледзець
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — да 2 Гб
Абнавіць для пашыраных
Private transcript
Чат з транскрыптам
Разблакаваць з Pro →
Абнавіць для пашыраных
Запіс: 0:00
Рэальны час Воск (хвілінны)
Пашыраны Шчырасць (дакладнасць)
Публічныя спасылкі: 24h, толькі тэкст · Падпісацца для 7d + audio · Прафесійны для прыватных спасылак

Праграма перакладу мовы ў тэкст у рэальным часе. Шчыльны разумны код аўтаматычна выпраўляе памылкі падчас гутаркі.

Спачатку праверце мікрафон
❤️ Любіце STT.ai? Раскажыце сваім сябрам!
Вы скарысталі свае свабодныя транскрыпцыі

У 1996 годзе 600-гадовы юбілей свята адзначаўся ў рамках рэспубліканскага свята «Дзень кнігі».

10 вольных хвілін/ дзень 600 мін. бясплатна пры рэгістрацыі Крэдытная карта Зашыфравана
Зарэгіструйцеся бясплатна →
5.1%
WER
99
Languages
32.0x
Speed
MIT
License

About Whisper Turbo

Часта задаваемыя пытанні

Whisper Turbo - гэта мадэль пераўтварэння мовы ў тэкст ад OpenAI. STT.ai размяшчае Whisper Turbo на нашай інфраструктуры GPU, таму вы можаце выкарыстоўваць яго без стварэння свайго апаратнага забеспячэння - загрузіце аўдыё або відэа і выберыце Whisper Turbo з выбару мадэлі.

На стандартных тэставанні, Whisper Turbo дасягае каля 5.1% Word Error Rate. Рэальная дакладнасць залежыць ад якасці гуку, акцэнту і мовы; для шумных або акцэнтаваных запісаў чакайце на некалькі працэнтных пунктаў вышэй WER.

Whisper Turbo працуе на бясплатным узроўні STT.ai — кожны наведвальнік атрымлівае 600 хвілін / месяц бясплатна. Плацежныя планы дадаюць большыя абмежаванні на файл, прыватныя транскрыпты і прыярытэтнае чаканне.

Whisper Turbo выпушчаны пад ліцэнзіяй MIT, дазваляе адкрыты код. Вы можаце самастойна ўсталяваць Whisper Turbo на вашым камп' ютары або выкарыстоўваць нашу версію - абодва могуць быць выкарыстаны ў камерцыйных мэтах.

Whisper Turbo падтрымлівае 99 моў. Аўтаматычнае выяўленне выбірае правільную мову для большасці гукаў; вы таксама можаце вызначыць яе ўручную для невялікага павышэння дакладнасці.

Whisper Turbo апрацоўвае аўдыё з хуткасцю 32.0x у рэальным часе на нашых GPU. 1- гадзінны аўдыё файл скончыцца менш чым за 1 хвіліны; даўжэйшыя файлы будуць адпраўляцца ў чаргу і абвяшчаць па электроннай пошце, калі яны будуць завершаны.

Whisper Turbo мае параметры 809M. Большыя мадэлі больш дакладныя, але павольнейшыя; STT.ai мае Whisper Turbo на GPU, таму колькасць параметраў не ўплывае на хуткасць працы кліента.

Whisper Turbo прымае ўсе фарматы, якія падтрымлівае STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI і іншыя. Вывад у фармаце TXT, SRT, VTT, DOCX, JSON або PDF.

Так. Дыярызацыя гукавых файлаў працуе разам з Whisper Turbo для кожнай транскрыпцыі - кожны гукавы файл мае этыкетку, і вы можаце змяніць яго назву ў рэдактара пасля.

Так. Whisper Turbo працуе ў нашым кіруемым асяроддзі - гук апрацоўваецца і выдаляецца па змаўчанні і ніколі не выкарыстоўваецца для трэніровак без выразнага дазволу. Планы Pro дадаюць шыфраванне з боку кліента для транскрыптаў у спакоі.

Выкарыстоўвайце інструмент compare-stt, каб правесці параўнанне Whisper Turbo з любым іншым падтрымліваемым мадэллю на тым жа аўдыё - вы ўбачыце WER, колькасць сегментаў, этыкеткі дынамікаў і рэйтынгі даверу бок аб бок. Параўнанне Whisper Turbo супраць Whisper Large V3 - гэта найбольш частае параўнанне.

Так. Вызначце "whisper-turbo" як параметр мадэлі ў канечнай кропцы /v1/transcribe. Python і Node.js SDK ўключаюць прыклады Whisper Turbo. Бясплатны ўзровень API ўключае 100 хвілін / месяц.

Так. Паколькі Whisper Turbo мае ліцэнзію MIT, вы можаце самастойна яго ўсталяваць. На старонцы адкрытага кода STT.ai паказаны рэпазітары і вагі праекту. Большасць каманд выкарыстаюць нашу ўсталяваную версію, каб прапусціць закупку GPU, абмен мадэлямі і аперацыі.