Паведаміць пра памылку / запыт на магчымасць

Перапісаць з Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Працуе з публічна даступнымі аўдыё і відэа. Змест, абаронены DRM, не падтрымліваецца.

Абнавіць для пашыраных

Прыватная транскрыпцыя

Чат з транскрыптам

Разблакаваць з Pro →

Перамясціце файл сюды або націсніце, каб прагледзець

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — да 2 Гб

Пакетная загрузка некалькіх файлаў з Pro

Абнавіць для пашыраных

Прыватная транскрыпцыя

Чат з транскрыптам

Разблакаваць з Pro →

Абнавіць для пашыраных

Праграма перакладу мовы ў тэкст у рэальным часе. Шчыльны разумны код аўтаматычна выпраўляе памылкі падчас гутаркі.

Спачатку праверце мікрафон

10 вольных хвілін/ дзень 600 мін. бясплатна пры рэгістрацыі Крэдытная карта Зашыфравана

Зарэгіструйцеся бясплатна →

5.8%

WER

Мовы

48.0x

Хуткасць

MIT

Ліцэнзія

Пра Distil-Whisper

Distil- Whisper - гэта дыстыляваны варыянт Whisper, створаны Hugging Face. Ён зменшыў памер мадэлі на 49% і дасягнуў 6x хутчэйшага вываду, захоўваючы ў межах 1% WER арыгінальнага Whisper Large V2 на не- дыстрыбуцыйных наборах ацэнкі.

Мовы, якія падтрымліваюцца Distil-Whisper

Англійская

Іспанская

Французская

Нямецкая

Кітайская

Японская

Карэйская

Партугальская

Арабская

Хіндзі

Руская

Італьянская

Нідэрландская

Турэцкая

Польская

Шведская

Інданезійская

Тайская

В’етнамская

Чэшская

Грэчаская

Румынская

Венгерская

Іўрыт

Дацкая

Фінская

Нарвежская

Украінская

Малайская

Бенгальская

Звесткі пра мадэль

ПастаўшчыкHugging Face
Архітэктура-
ЛіцэнзіяMIT
АбнавіцьMar 2026

Падобныя мадэлі

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Часта задаваемыя пытанні

Distil-Whisper - гэта мадэль пераўтварэння мовы ў тэкст ад Hugging Face. STT.ai размяшчае Distil-Whisper на нашай інфраструктуры GPU, таму вы можаце выкарыстоўваць яго без стварэння свайго апаратнага забеспячэння - загрузіце аўдыё або відэа і выберыце Distil-Whisper з выбару мадэлі.

На стандартных тэставанні, Distil-Whisper дасягае каля 5.8% Word Error Rate. Рэальная дакладнасць залежыць ад якасці гуку, акцэнту і мовы; для шумных або акцэнтаваных запісаў чакайце на некалькі працэнтных пунктаў вышэй WER.

Distil-Whisper працуе на бясплатным узроўні STT.ai - кожны наведвальнік атрымлівае 600 хвілін, каб пачаць без платы. Плацежныя планы дадаюць большыя абмежаванні на файл, прыватныя транскрыпты і прыярытэтныя чаргі.

Distil-Whisper выпушчаны пад ліцэнзіяй MIT, дазваляе адкрыты код. Вы можаце самастойна ўсталяваць Distil-Whisper на вашым камп' ютары або выкарыстоўваць нашу версію - абодва могуць быць выкарыстаны ў камерцыйных мэтах.

Distil-Whisper падтрымлівае 99 моў. Аўтаматычнае выяўленне выбірае правільную мову для большасці гукаў; вы таксама можаце вызначыць яе ўручную для невялікага павышэння дакладнасці.

Distil-Whisper апрацоўвае аўдыё з хуткасцю 48.0x у рэальным часе на нашых GPU. 1- гадзінны аўдыё файл скончыцца менш чым за 1 хвіліны; даўжэйшыя файлы будуць адпраўляцца ў чаргу і абвяшчаць па электроннай пошце, калі яны будуць завершаны.

Distil-Whisper мае параметры 756M. Большыя мадэлі больш дакладныя, але павольнейшыя; STT.ai мае Distil-Whisper на GPU, таму колькасць параметраў не ўплывае на хуткасць працы кліента.

Distil-Whisper прымае ўсе фарматы, якія падтрымлівае STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI і іншыя. Вывад у фармаце TXT, SRT, VTT, DOCX, JSON або PDF.

Так. Дыярызацыя гукавых файлаў працуе разам з Distil-Whisper для кожнай транскрыпцыі - кожны гукавы файл мае этыкетку, і вы можаце змяніць яго назву ў рэдактара пасля.

Так. Distil-Whisper працуе ў нашым кіруемым асяроддзі - гук апрацоўваецца і выдаляецца па змаўчанні і ніколі не выкарыстоўваецца для трэніровак без выразнага дазволу. Планы Pro дадаюць шыфраванне з боку кліента для транскрыптаў у спакоі.

Выкарыстоўвайце інструмент compare-stt, каб правесці параўнанне Distil-Whisper з любым іншым падтрымліваемым мадэллю на тым жа аўдыё - вы ўбачыце WER, колькасць сегментаў, этыкеткі дынамікаў і рэйтынгі даверу бок аб бок. Параўнанне Distil-Whisper супраць Whisper Large V3 - гэта найбольш частае параўнанне.

Так. Вызначце "distil-whisper" як параметр мадэлі ў канечнай кропцы /v1/transcribe. Python і Node.js SDK ўключаюць прыклады Distil-Whisper. Бясплатны ўзровень API ўключае 100 хвілін / месяц.

Так. Паколькі Distil-Whisper мае ліцэнзію MIT, вы можаце самастойна яго ўсталяваць. На старонцы адкрытага кода STT.ai паказаны рэпазітары і вагі праекту. Большасць каманд выкарыстаюць нашу ўсталяваную версію, каб прапусціць закупку GPU, абмен мадэлямі і аперацыі.

Перапісаць з Distil-Whisper

Пра Distil-Whisper

Мовы, якія падтрымліваюцца Distil-Whisper

Звесткі пра мадэль

Падобныя мадэлі

Часта задаваемыя пытанні

Насельніцтва 88,8 тыс. чал.

Насельніцтва 88,8 тыс. чал.

Distil-Whisper карыстаюцца бясплатна?

Якая ліцэнзія выкарыстоўваецца для Distil-Whisper?

Колькі моў падтрымлівае Distil-Whisper?

Насельніцтва 88,8 тыс. чал.

Насельніцтва 88,0 тыс. чал.

Усяго ў ёй Distil-Whisper артыкулаў.

Distil-Whisper карыстальнікаў.

Ці прыватныя мае дадзеныя, калі я карыстаюся Distil-Whisper?

У 880 годзе ўступіў у саюз з Візантыяй.

Ці магу я выкарыстоўваць Distil-Whisper праз API?

Ці магу я запусціць Distil-Whisper на сваім серверы?