Transcribe with Whisper Large V3

Pracuje s veřejně dostupným audio & video. DRM-chráněný obsah není podporován.

Upgrade pro vylepšené
Private transcript
Chat s přepisem
Odemknout s Pro →
Drop soubor zde nebo klikněte na prohlížení
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM do 2GB
Upgrade pro vylepšené
Private transcript
Chat s přepisem
Odemknout s Pro →
Upgrade pro vylepšené
Nahrávání: 0:00
V reálném čase Vosk (v okamžiku)
Rozšířené Šepot (přesný)
Veřejné odkazy: 24h, pouze text · Zaregistrovat se pro 7d + audio · Pro pro soukromé spoje

V reálném čase řeč k textu. AI auto-opravy, jak mluvíte, přesnost se zlepšuje s delší řečí.

Nejdřív si otestuj mikrofon.
❤️ Love STT.ai? Tell your friends!
Použil jsi své svobodné přepisy.

Zaregistrujte se zdarma získat 600 minut / měsíc, nebo upgrade pro neomezené přepisy.

10 volných min/den 600 min zdarma s přihlášením Žádná kreditní karta Zašifrováno
Zaregistrujte se zdarma →
4.2%
WER
99
Languages
8.0x
Speed
MIT
License

About Whisper Large V3

Často kladené otázky

Whisper Large V3 je ukázkový model od OpenAI. STT.ai hostů Whisper Large V3 na naší GPU infrastruktuře, takže ji můžete použít bez poskytnutí vlastního hardwaru a nahrát audio nebo video a vybrat Whisper Large V3 z modelového sběrače.

Na standardních referenčních hodnotách dosahuje Whisper Large V3 přibližně 4.2% Word Error Rate. Skutečná přesnost závisí na kvalitě zvuku, přízvuku a jazyku; u hlučných nebo akcentovaných nahrávek očekáváme o několik procentních bodů vyšší WER.

Whisper Large V3 běží na STT.ai volných úrovní, každý návštěvník dostane 600 minut / měsíc bez nákladů. Placené plány přidat déle na-file limity, soukromé přepisy, a prioritní fronty.

Whisper Large V3 je uvolněno pod MIT, povolná open-source licence. Můžete self-host Whisper Large V3 na vašem vlastním hardwaru, nebo použít naši hostitelskou verzi dírky oba jsou komerčně použitelné.

Whisper Large V3 podporuje 99 jazyků. Auto-detekce vybírá správný jazyk pro většinu audio; můžete jej také ručně zadat pro malý výtah přesnosti.

Whisper Large V3 zpracovává audio na cca 8.0x v reálném čase na našich GPU. 1-hodinový audio soubor končí za méně než 7 minut; delší fronta souborů a upozornění e-mailem, když je hotovo.

Whisper Large V3 má 1.55B parametrů. Větší modely mají tendenci být přesnější, ale pomalejší; STT.ai hostů Whisper Large V3 na GPU, takže počet parametrů nemá vliv na výkon na straně klienta.

Whisper Large V3 přijímá každý formát STT.ai podporuje MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a další. Výstup jako TXT, SRT, VTT, DOCX, JSON, nebo PDF.

Ano. Diarizace reproduktorů vede vedle Whisper Large V3 pro každý přepis a každý reproduktor je označen a můžete je přejmenovat v editoru později.

Ano. Whisper Large V3 běží v našem řízeném prostředí Audio je zpracováno a smazáno ve výchozím nastavení a nikdy se nepoužívá pro trénink bez explicitního opt-inu. Pro plány přidat klient-strana šifrování pro přepisy v klidu.

Pomocí porovná-stt nástroj spustit Whisper Large V3 proti jakémukoliv jinému podporovanému modelu na stejném zvuku, budete vidět WER, počet segmentů, reproduktory štítky, a sebedůvěry skóre vedle sebe. Whisper Large V3 vs Whisper Large V3 srovnání je nejčastějším spuštěním.

Ano. Zadejte "whisper-large-v3" jako parametr modelu na cílovém parametru /v1/transcribe. Python a Node.js SDKs obsahují Whisper Large V3 příklady. Bezplatná úroveň API zahrnuje 100 minut/měsíc.

Ano. Vzhledem k tomu, Whisper Large V3 je MIT-licencován, můžete si ho sami-hostit. STT.ai open-source stránky uvádí projekt repo a váhy. Většina výrobních týmů používá naši hostitelskou verzi přeskočit GPU zadávání zakázek, modelové swapy, a ops.