Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Gyakran ismételt kérdések
SenseVoice egy beszéd-to-text modell FunAudioLLM, STT.ai hosts SenseVoice a mi GPU infrastruktúra, így használhatja anélkül, hogy a saját hardvere feltölti audio vagy videó, és vegye SenseVoice a modell picker.
A standard referenciaértékek, SenseVoice eléri mintegy 5.5%-os Word Error Rate. A valós világ pontossága függ a hangminőség, az akcentus és a nyelv; a zajos vagy kihangsúlyozott felvételek, számíthat néhány százalékponttal magasabb WER.
SenseVoice fut a STT.ai's free level -on minden látogató kap 600 percet/hót ingyen. Fizetett tervek hozzá hosszabb per-file limitek, privát átiratok, és elsőbbségi sorban.
SenseVoice kerül kiadásra MIT, egy engedékeny nyílt forráskódú licenc. Önálló SenseVoice saját hardveren, vagy használja a mi hosted verziónk mind kereskedelmileg használható.
SenseVoice támogatja a 50 nyelvet. Auto-detection kiválasztja a megfelelő nyelvet a legtöbb audio; akkor is megadhatja manuálisan egy kis pontosságú lift.
SenseVoice audiót készít körülbelül 50.0x valós idejű GPU-n. Egy 1 órás audio fájl 1 perc alatt fejeződik be; hosszabb fájlok sorba állnak, és e-mailben értesítik őket.
SenseVoice van 234M paraméterek. Nagyobb modellek általában pontosabb, de lassabb; STT.ai hosts SenseVoice a GPU, így a paraméterszám nem befolyásolja az ügyfél-oldal teljesítményét.
SenseVoice minden formátumot elfogad, STT.ai támogatja az MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI és mások. Kimeneti mint TXT, SRT, VTT, DOCX, JSON, vagy PDF.
Igen. A szónoki diarization SenseVoice-rel együtt fut minden egyes átirathoz ~ minden hangszórót felcímkéznek, és utána átnevezheted őket a szerkesztőbe.
Igen. SenseVoice fut a mi kezelt környezetben Audio feldolgozzák és törölték alapértelmezésben, és soha nem használják képzés kifejezett opt-in nélkül. Pro tervek hozzá kliens-oldal titkosítását átiratok pihenni.
Használja a összehasonlítani-stt eszköz futtatni SenseVoice ellen bármely más támogatott modell ugyanazon audio ★ látni fogja WER, szegmensszám, hangszóró címkék, és a konfidencia pontszámok oldalról oldalra. A SenseVoice vs Whisper Large V3 összehasonlítás a leggyakrabban fut.
Igen. A Python és a Node.js SDK-k SenseVoice példát tartalmaznak. A Free API-szint 100 percet/hónapot tartalmaz.
Igen. Mivel a SenseVoice MIT engedéllyel rendelkezik, saját maga is üzemeltetheti. STT.ai nyílt forráskódú oldala felsorolja a projekt repo- és súlyait. A legtöbb gyártócsapat a GPU beszerzések, modellswapok és op-ok kihagyására használja a hostált verziónkat.