Transcribe with Distil-Whisper

Очиқ аудио ва видео билан ишлайди. DRM-хавфсиз мазмун қўлланилмайди.

Фаолиятни кучайтириш учун янгилаш
Private transcript
Транскрипт билан суҳбатлашиш
Pro билан қулфни очиш →
Файлни бу ерга ташланг ёки кўриш учун босинг
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2GB гача
Фаолиятни кучайтириш учун янгилаш
Private transcript
Транскрипт билан суҳбатлашиш
Pro билан қулфни очиш →
Фаолиятни кучайтириш учун янгилаш
Ёзув: 0:00
Тўғридан-тўғри Вакуум (ҳозирги)
Ёрдамчи Шивирлаш (тўғри)
Жамият алоқалари: 24 соат, фақат матн · Ёзиш 7d + аудио учун · Про шахсий алоқалар учун

Реал вақтдаги сўзлашув матнга. AI сиз гапираётганда автоматик тузатади - тўғрилиги гапириш узоқроқ бўлганида яхшиланади.

Аввал микрофонингизни текширинг
❤️ STT.aiни севасанми? Дўстларингга айт!
Сиз бепул транскрипцияларни ишлатгансиз

600 дақиқа/ойга бепул рўйхатдан ўтинг ёки чекланмаган транскрипциялар учун янгиланинг.

Кунига 10 қийматли дақиқа 600 дақиқа бепул Кредит картаси йўқ Шифрланмаган
Бепул рўйхатдан ўтинг →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Кўп бериладиган саволлар

Distil-Whisper Hugging Face томонидан сўздан матнга моделдир. STT.ai Distil-Whisper ни GPU инфратузилмасида сақлайди, шунинг учун сиз уни ўз жиҳозингизни таъминламасдан фойдалана оласиз — аудио ёки видео юклаб олиб, Distil-Whisper ни модел танловчидан танлайсиз.

Стандарт бенчмаркларда Distil-Whisper та сўз хатосининг 5.8% га етишини кўрсатади. Ҳақиқий аниқлик аудио сифати, акцент ва тилга боғлиқ; шовқинли ёки акцентли ёзувлар учун WER дан бир неча фоиз юқори бўлишини кутиш мумкин.

Distil-Whisper STT.ai'нинг бепул даражасида ишлайди — ҳар бир меҳмон ойига 600 дақиқа бепул олади. Умумий тарифлар ҳар бир файл учун узоқроқ чегараларни, шахсий транскриптларни ва устувор навбатни қўшиб беради.

Distil-Whisper MIT лицензияси остида чиқарилган, бу оммавий очиқ манбали лицензиядир. Сиз Distil-Whisper ни ўз қурилмангизда ёки бизнинг хост қилинган версиямизда ўзингизга жойлаштирсангиз бўлади — иккаласи ҳам савдо учун ишлатилиши мумкин.

Distil-Whisper 99 тилларни қўллаб-қувватлайди. Авто-таърифлаш кўплаб аудио учун тўғри тилни танлайди; сиз уни кичик аниқлик учун қўлда ҳам белгилашингиз мумкин.

Distil-Whisper аудиони GPUларда 48.0x реал вақтда ишлайди. 1 соатлик аудио файл 1 дақиқада тугайди; узун файллар навбатда туради ва тугаганида электрон почта орқали хабар беради.

Distil-Whisper нинг 756M параметрлари бор. Кўпроқ моделлар аниқроқ, аммо секинроқ; STT.ai GPUда Distil-Whisper ни қабул қилади, шунинг учун параметрлар сони сизнинг клиент томони ишлашингизга таъсир қилмайди.

Distil-Whisper STT.ai қўллаб-қувватлайдиган барча форматларни қабул қилади — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ва бошқалар. Тўқима TXT, SRT, VTT, DOCX, JSON ёки PDF шаклида.

Ҳа. Ҳар бир транскрипция учун Distil-Whisper билан биргаликда сўзловчилар рўйхати ишлайди - ҳар бир сўзловчи белгиланади ва кейинчалик уларни редакторда қайта номлашингиз мумкин.

Ҳа. Distil-Whisper бизнинг бошқариладиган муҳитда ишлайди — аудио ишланади ва стандарт тарзда ўчирилади ва ҳеч қачон очиқ танловсиз машғулот учун фойдаланилмайди. Pro режалари дам олганда ёзилган транскриптлар учун клиент томони шифрлашини қўшиб беради.

Distil-Whisper'ни бошқа қўллаб-қувватланадиган моделлар билан бир хил аудиода ишлатиш учун compare-stt асбобидан фойдаланинг — сиз WER, сегментлар сони, овоз берувчиларнинг белгилари ва ишончлилик балларини бир-бирига қарама-қарши кўришингиз мумкин. Distil-Whisper ва Whisper Large V3 ўртасидаги таққослашни энг кўп ишлатиш мумкин.

Ҳа. /v1/transcribe охирида "distil-whisper" модели параметрини кўрсатинг. Python ва Node.js SDK лар Distil-Whisper мисолларни ўз ичига олади. Бепул API даражаси ойига 100 дақиқани ўз ичига олади.

Ҳа. Distil-Whisper MIT лицензиясига эга бўлгани учун, сиз уни ўзингиз хост қила оласиз. STT.ai'нинг очиқ манба саҳифасида лойиҳа репозиторияси ва вазнлари кўрсатилган. Продукция жамоаларининг кўпчилиги GPU харид қилиш, модел алмаштириш ва ишга тушириш учун бизнинг хост қилинган версиямизни фойдаланади.