Бусад

Энэ програмд бич Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Олон нийтэд нээлттэй дуу болон видеог ашиглана. DRM-ээр хамгаалагдсан агуулга дэмжигдэхгүй.

Шинэчлэх

Хувийн бичлэг

Хуучин мессеж

Про- гоор нээх →

Файлуудыг энд буулгах эсвэл хайхдаа дарна уу

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2ГБ хүртэл

Олон файлыг нэгтгэн өргөтгөх Про

Шинэчлэх

Хувийн бичлэг

Хуучин мессеж

Про- гоор нээх →

Шинэчлэх

Үнэгүй, бодит цаг хугацаанд яриаг текст болгон хувиргах. Таны яриаг AI автоматаар засдаг. Урт яриагаар илүү нарийвчлалтай болно.

Эхлээд микрофоноо шалга

10 чөлөөт минут/өдөр 600 минут үнэгүй Кредит картгүй Нууцлагдсан

Үнэгүй бүртгүүлэх →

5.8%

WER

Хэл

48.0x

Хурд

MIT

Лиценз

Тодорхойлолт Distil-Whisper

Distil- Whisper бол Hugging Face- ийн бүтээсэн Whisper-ийн дистиллэсэн хувилбар юм. Энэ нь загварын хэмжээг 49% - аар багасгаж, 6x хурдан дүгнэлт хийх боломжийг олгодог бөгөөд 1% WER-ийг үл хамаарах үнэлгээний багц дээрх Whisper Large V2-ийн 1% - ийн дотор хадгалдаг.

Тусламжтай хэлнүүд Distil-Whisper

Англи

Испани

Франц

Герман

Хятад

Япон

Солонгос

Португал

Араб

Хинди

Орос

Итали

Нидерланд

Турк

Польш

Швед

Индонези

Тай

Вьетнам

Чех

Грек

Румын

Мажар

Еврей

Дани

Фин

Норвег

Украин

Малай

Бенгал

Модель мэдээ

Үйлчилгээ үзүүлэгчHugging Face
Архитектур-
ЛицензMIT
ШинэчлэгдсэнMar 2026

Харилцан адилгүй загварууд

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Заримдаа асуудаг асуултууд

Distil-Whisper нь Hugging Face-ийн ярианаас текст болгох загвар юм. STT.ai нь Distil-Whisper-ийг бидний график процессорын дэд бүтцэд байрлуулсан тул та өөрийнхөө тоног төхөөрөмжийг ашиглахгүйгээр ашиглаж болно. Аудио болон видеог татаж авч, загвар сонгогчоос Distil-Whisper-ийг сонгоно уу.

Стандарт үзүүлэлтээр Distil-Whisper нь 5.8% үгийн алдааны түвшинг хангадаг. Үнэн хэрэгтээ энэ нь дууны чанар, өнгө, хэлнээс хамаарна. Хөгжим дуугарч байгаа үед WER-ийг хэд хэдэн хувь нэмэгдүүлэх хэрэгтэй.

Distil-Whisper нь STT.ai-ийн үнэгүй түвшинд ажилладаг - бүх зочид 600 минутын үнэгүй эхлүүлэх хугацаатай. Үнэтэй төлөвлөгөө нь файл бүрийн урт хугацааны хязгаар, хувийн бичлэг, тэргүүлэх гүйлгээний тоог нэмдэг.

Distil-Whisper нь MIT, нээлттэй эхийн лицензийн дор гарсан. Та Distil-Whisper-ийг өөрийнхөө тоног төхөөрөмж дээр байршуулж эсвэл манай байршуулсан хувилбарыг ашиглаж болно. Хоёулаа худалдааны зориулалттай.

Distil-Whisper нь 99 хэлийг дэмждэг. Автомат олж илрүүлэх нь олон аудиод тохирох хэлийг сонгоно. Та үүнийг гараараа тодорхойлж, бага зэрэг нарийвчлал нэмэгдүүлэх боломжтой.

Distil-Whisper нь бидний GPU дээр 48.0x бодит цагаар аудиог боловсруулдаг. 1 цагийн аудио файл 1 минутын дотор дуусна; урт файлууд дараалалд орж дууссаны дараа имэйлээр мэдэгдэнэ.

Distil-Whisper нь 756M параметртэй. Том загварууд илүү нарийвчлалтай боловч хурд багатай байдаг; STT.ai нь Distil-Whisper-ийг график процессор дээр байрлуулдаг тул параметрийн тоо нь таны клиентийн талд нөлөөлөхгүй.

Distil-Whisper нь STT.ai-ийн дэмждэг бүх форматыг хүлээн авдаг - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, болон бусад. Түүний гаралт нь TXT, SRT, VTT, DOCX, JSON, эсвэл PDF.

Тийм ээ. Бүх бичлэгийн хувьд Distil-Whisper-тай хамт дуут дохионы тэмдэглэгээ хийгддэг. Бүх дуут дохионууд нь тэмдэглэгээтэй бөгөөд редакторт нэрийг нь өөрчилж болно.

Тийм. Distil-Whisper нь бидний удирдсан орчинд ажилладаг — аудио нь урьдчилан боловсруулж устгагдсан бөгөөд тодорхой зөвшөөрөлгүйгээр хэзээ ч сургалтанд ашиглагддаггүй. Pro төлөвлөгөө нь хэвийн үед хадгалагдсан бичлэгийг клиентийн талд шифрлэдэг.

Distil-Whisper-ийг дэмждэг бусад загвартай харьцуулахад compare-stt хэрэгслийг ашиглана уу. Та WER, сегментийн тоо, дуут дохионы тэмдэг, найдвартай байдлын оноог хамтдаа харах болно. Distil-Whisper-ийг Whisper Large V3-тэй харьцуулах нь хамгийн түгээмэл хийгддэг.

Тийм. /v1/transcribe төгсгөлийн цэгт "distil-whisper" загварын параметрийг заана уу. Python болон Node.js SDK-д Distil-Whisper жишээ багтсан. Үнэгүй API түвшин нь сарын 100 минутыг багтаасан.

Тийм ээ. Distil-Whisper нь MIT лицензтэй тул та үүнийг өөрийнхөө сервер дээр байрлуулж болно. STT.ai-ийн нээлттэй эхийн хуудас нь төслийн репозитори болон жингүүдийг жагсаана. Ихэнх үйлдвэрлэлийн багууд бидний хостлагдсан хувилбарыг GPU худалдан авалт, загвар солилцоо, үйл ажиллагааг орхиход ашигладаг.

Энэ програмд бич Distil-Whisper

Тодорхойлолт Distil-Whisper

Тусламжтай хэлнүүд Distil-Whisper

Модель мэдээ

Харилцан адилгүй загварууд

Заримдаа асуудаг асуултууд

Distil-Whisper гэж юу вэ?

Distil-Whisper хэр үнэн бэ?

Distil-Whisper үнэгүй ашиглах боломжтой юу?

Distil-Whisper ямар лиценз ашигладаг вэ?

Distil-Whisper хэдэн хэлийг дэмждэг вэ?

Distil-Whisper хэр хурдан вэ?

Distil-Whisper загвар хэр том вэ?

Distil-Whisper ямар аудио форматуудыг хөрвүүлэх боломжтой вэ?

Distil-Whisper олон дуут дохиог мэддэг үү?

Distil-Whisper ашиглахдаа миний мэдээллийг нууцлах уу?

Distil-Whisper-ийг бусад STT загваруудтай хэрхэн харьцуулж болох вэ?

Би Distil-Whisper-г API-ээр ашиглаж болох уу?

Би өөрийн сервер дээрээ Distil-Whisper-г ажиллуулж болох уу?