Transcribe with Distil-Whisper

Működik nyilvánosan elérhető audio & video. DRM-védett tartalom nem támogatott.

Frissítés a továbbfejlesztett
Private transcript
Csevegés átirattal
Kinyitni a Pro-val →
Drop fájl itt vagy kattintson a böngészésre
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM maximum 2GB
Több fájl feltöltése (lásd 4. 4 pont)
Frissítés a továbbfejlesztett
Private transcript
Csevegés átirattal
Kinyitni a Pro-val →
Frissítés a továbbfejlesztett
Felvétel: 0:00
Valós idejű Vosk (instant)
Továbbfejlesztett@ info: whatsthis Suttogó (pontos)
Nyilvános linkek: 24h, csak szöveg · Regisztrálj! 7d + audio · Pro magánkapcsolatok esetében

Valós idejű beszéd szöveg. AI automatikus javítások, ahogy beszél A pontosság hosszabb beszéddel javul.

Először teszteld a mikrofonodat.
❤️ Love STT.ai? Tell your friends!
Használtad az ingyenes átirataidat.

Regisztráljon ingyenes, hogy 600 perc / hónap, vagy frissítés korlátlan átiratok.

10 ingyenes min/nap 600 perc ingyenes regisztrációval Nincs hitelkártyája. Titkosított
Regisztrálj ingyen! →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Gyakran ismételt kérdések

Distil-Whisper egy beszéd-to-text modell Hugging Face, STT.ai hosts Distil-Whisper a mi GPU infrastruktúra, így használhatja anélkül, hogy a saját hardvere feltölti audio vagy videó, és vegye Distil-Whisper a modell picker.

A standard referenciaértékek, Distil-Whisper eléri mintegy 5.8%-os Word Error Rate. A valós világ pontossága függ a hangminőség, az akcentus és a nyelv; a zajos vagy kihangsúlyozott felvételek, számíthat néhány százalékponttal magasabb WER.

Distil-Whisper fut a STT.ai's free level -on minden látogató kap 600 percet/hót ingyen. Fizetett tervek hozzá hosszabb per-file limitek, privát átiratok, és elsőbbségi sorban.

Distil-Whisper kerül kiadásra MIT, egy engedékeny nyílt forráskódú licenc. Önálló Distil-Whisper saját hardveren, vagy használja a mi hosted verziónk mind kereskedelmileg használható.

Distil-Whisper támogatja a 99 nyelvet. Auto-detection kiválasztja a megfelelő nyelvet a legtöbb audio; akkor is megadhatja manuálisan egy kis pontosságú lift.

Distil-Whisper audiót készít körülbelül 48.0x valós idejű GPU-n. Egy 1 órás audio fájl 1 perc alatt fejeződik be; hosszabb fájlok sorba állnak, és e-mailben értesítik őket.

Distil-Whisper van 756M paraméterek. Nagyobb modellek általában pontosabb, de lassabb; STT.ai hosts Distil-Whisper a GPU, így a paraméterszám nem befolyásolja az ügyfél-oldal teljesítményét.

Distil-Whisper minden formátumot elfogad, STT.ai támogatja az MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI és mások. Kimeneti mint TXT, SRT, VTT, DOCX, JSON, vagy PDF.

Igen. A szónoki diarization Distil-Whisper-rel együtt fut minden egyes átirathoz ~ minden hangszórót felcímkéznek, és utána átnevezheted őket a szerkesztőbe.

Igen. Distil-Whisper fut a mi kezelt környezetben Audio feldolgozzák és törölték alapértelmezésben, és soha nem használják képzés kifejezett opt-in nélkül. Pro tervek hozzá kliens-oldal titkosítását átiratok pihenni.

Használja a összehasonlítani-stt eszköz futtatni Distil-Whisper ellen bármely más támogatott modell ugyanazon audio ★ látni fogja WER, szegmensszám, hangszóró címkék, és a konfidencia pontszámok oldalról oldalra. A Distil-Whisper vs Whisper Large V3 összehasonlítás a leggyakrabban fut.

Igen. A Python és a Node.js SDK-k Distil-Whisper példát tartalmaznak. A Free API-szint 100 percet/hónapot tartalmaz.

Igen. Mivel a Distil-Whisper MIT engedéllyel rendelkezik, saját maga is üzemeltetheti. STT.ai nyílt forráskódú oldala felsorolja a projekt repo- és súlyait. A legtöbb gyártócsapat a GPU beszerzések, modellswapok és op-ok kihagyására használja a hostált verziónkat.