Nahlásit chybu / žádost o funkci

Přepsat s SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Pracuje s veřejně dostupným audio & video. DRM-chráněný obsah není podporován.

Upgrade pro vylepšené

Soukromý přepis

Chat s přepisem

Odemknout s Pro →

Drop soubor zde nebo klikněte na prohlížení

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM do 2GB

Šarže nahrávat více souborů s Pro

Upgrade pro vylepšené

Soukromý přepis

Chat s přepisem

Odemknout s Pro →

Upgrade pro vylepšené

V reálném čase řeč k textu. AI auto-opravy, jak mluvíte, přesnost se zlepšuje s delší řečí.

Nejdřív si otestuj mikrofon.

10 volných min/den 600 min zdarma s přihlášením Žádná kreditní karta Zašifrováno

Zaregistrujte se zdarma →

5.5%

WER

Jazyky

50.0x

Rychlost

MIT

Licence

O aplikaci SenseVoice

SenseVoice je model nadace řeči od FunAudioLLM, který přesahuje transkripci. Podporuje 50+ jazyky a obsahuje možnosti pro rozpoznávání emocí, detekci zvukových událostí a inverzní normalizaci textu v jednom modelu.

Jazyky podporované SenseVoice

Angličtina

Španělština

Francouzština

Němčina

Čínština

Japonština

Korejština

Portugalština

Arabština

Hindština

Ruština

Italština

Nizozemština

Turečtina

Polština

Švédština

Indonéština

Thajština

Vietnamština

Čeština

Řečtina

Rumunština

Maďarština

Hebrejština

Dánština

Finština

Norština

Ukrajinština

Malajština

Bengálština

Informování o modelu

PoskytovatelFunAudioLLM
Architektura-
LicenceMIT
AktualizovánoMar 2026

Související modely

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Často kladené otázky

SenseVoice je ukázkový model od FunAudioLLM. STT.ai hostů SenseVoice na naší GPU infrastruktuře, takže ji můžete použít bez poskytnutí vlastního hardwaru a nahrát audio nebo video a vybrat SenseVoice z modelového sběrače.

Na standardních referenčních hodnotách dosahuje SenseVoice přibližně 5.5% Word Error Rate. Skutečná přesnost závisí na kvalitě zvuku, přízvuku a jazyku; u hlučných nebo akcentovaných nahrávek očekáváme o několik procentních bodů vyšší WER.

SenseVoice běží na STT.ai je zdarma úroveň? Každý návštěvník dostane 600 minut začít bez nákladů. Placené plány přidat déle na-file limity, soukromé přepisy, a prioritní fronty.

SenseVoice je uvolněno pod MIT, povolná open-source licence. Můžete self-host SenseVoice na vašem vlastním hardwaru, nebo použít naši hostitelskou verzi dírky oba jsou komerčně použitelné.

SenseVoice podporuje 50 jazyků. Auto-detekce vybírá správný jazyk pro většinu audio; můžete jej také ručně zadat pro malý výtah přesnosti.

SenseVoice zpracovává audio na cca 50.0x v reálném čase na našich GPU. 1-hodinový audio soubor končí za méně než 1 minut; delší fronta souborů a upozornění e-mailem, když je hotovo.

SenseVoice má 234M parametrů. Větší modely mají tendenci být přesnější, ale pomalejší; STT.ai hostů SenseVoice na GPU, takže počet parametrů nemá vliv na výkon na straně klienta.

SenseVoice přijímá každý formát STT.ai podporuje MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a další. Výstup jako TXT, SRT, VTT, DOCX, JSON, nebo PDF.

Ano. Diarizace reproduktorů vede vedle SenseVoice pro každý přepis a každý reproduktor je označen a můžete je přejmenovat v editoru později.

Ano. SenseVoice běží v našem řízeném prostředí Audio je zpracováno a smazáno ve výchozím nastavení a nikdy se nepoužívá pro trénink bez explicitního opt-inu. Pro plány přidat klient-strana šifrování pro přepisy v klidu.

Pomocí porovná-stt nástroj spustit SenseVoice proti jakémukoliv jinému podporovanému modelu na stejném zvuku, budete vidět WER, počet segmentů, reproduktory štítky, a sebedůvěry skóre vedle sebe. SenseVoice vs Whisper Large V3 srovnání je nejčastějším spuštěním.

Ano. Zadejte "sensevoice" jako parametr modelu na cílovém parametru /v1/transcribe. Python a Node.js SDKs obsahují SenseVoice příklady. Bezplatná úroveň API zahrnuje 100 minut/měsíc.

Ano. Vzhledem k tomu, SenseVoice je MIT-licencován, můžete si ho sami-hostit. STT.ai open-source stránky uvádí projekt repo a váhy. Většina výrobních týmů používá naši hostitelskou verzi přeskočit GPU zadávání zakázek, modelové swapy, a ops.

Přepsat s SenseVoice

O aplikaci SenseVoice

Jazyky podporované SenseVoice

Informování o modelu

Související modely

Často kladené otázky

Co je SenseVoice?

Jak přesné je SenseVoice?

Je SenseVoice zdarma k použití?

Jakou licenci používá SenseVoice?

Kolik jazyků podporuje SenseVoice?

Jak rychle je SenseVoice?

Jak velký je model SenseVoice?

Jaké audio formáty mohou 8000 přepsat?

Detekuje SenseVoice více reproduktorů?

Jsou moje data soukromá, když používají SenseVoice?

Jak se SenseVoice porovnat s ostatními modely STT?

Mohu použít SenseVoice přes API?

Můžu spustit SenseVoice na svém vlastním serveru?