Iulat ang Bug / Feature Request

Mag-translate sa SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Gumagana sa publikong magagamit na audio at video. DRM-protected na nilalaman ay hindi suportado.

Upgrade para sa Pinabuting

Pribadong transcript

Chat sa transcript

I-unlock sa Pro →

Drop file dito o mag-click upang mag-browse

Ang mga format ng video na suportado ay MP4, MOV, MKV, AVI, FLV, at iba pa.

I-upload ang maraming mga file sa Pro

Upgrade para sa Pinabuting

Pribadong transcript

Chat sa transcript

I-unlock sa Pro →

Upgrade para sa Pinabuting

Real-time na pagsasalita sa teksto. Nag-a-auto-correct ang AI habang nagsasalita ka — pinabuting katumpakan sa mas mahabang pagsasalita.

Subukan ang iyong microphone muna

10 libreng minuto/araw 600 minuto libreng may pag-signup Walang credit card Naka-encrypt

Mag-sign up para sa libreng →

5.5%

WER

Mga wika

50.0x

Bilis

MIT

Lisensya

Tungkol sa SenseVoice

Ang SenseVoice ay isang modelo ng pundasyon ng pagsasalita mula sa FunAudioLLM na lumalampas sa transkripsiyon. Sinusuportahan nito ang 50+ na wika at kasama ang mga kakayahan para sa pagkilala sa emosyon, pagtukoy ng audio event, at normalisasyon ng kabaligtaran na teksto sa isang solong modelo.

Mga wika na sinusuportahan ng SenseVoice

Ingles

Spanish

French

German

Chinese

Japanese

Korean

Portuguese

Arabic

Hindi

Russian

Italian

Dutch

Turkish

Polish

Swedish

Indonesian

Thai

Vietnamese

Czech

Greek

Romanian

Hungarian

Hebrew

Danish

Finnish

Norwegian

Ukranian

Malay

Bangla

Impormasyon ng Modelo

TagapagbigayFunAudioLLM
Arkitektura-
LisensyaMIT
Nai-updateMar 2026

Mga Kaugnay na Modelo

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Mga Madalas Itanong

STT.ai hosts SenseVoice sa aming GPU imprastraktura kaya maaari mong gamitin ito nang walang pagbibigay ng iyong sariling hardware — mag-upload ng audio o video at pumili SenseVoice mula sa modelo picker.

Sa mga pamantayan benchmarks, SenseVoice ay nakamit sa paligid ng 5.5% Word Error Rate. Real-world katumpakan ay depende sa kalidad ng audio, accent, at wika; para sa noisy o accented recordings, asahan ng ilang porsyento puntos mas mataas na WER.

SenseVoice ay tumatakbo sa STT.ai ng libreng antas - bawat bisita ay makakakuha ng 600 minuto upang magsimula sa walang gastos. Paid plano magdagdag ng mas mahabang bawat file na limitasyon, pribadong transcripts, at prayoridad queueing.

SenseVoice ay inilabas sa ilalim ng MIT, isang permissive open-source na lisensya. Maaari mong self-host SenseVoice sa iyong sariling hardware o gamitin ang aming hosted na bersyon - parehong commercially magagamit.

SenseVoice sumusuporta sa 50 wika. Auto-detection picks ang tamang wika para sa karamihan ng audio; maaari mo ring tukuyin ito nang manu-mano para sa isang maliit na katumpakan lift.

SenseVoice proseso audio sa tungkol sa 50.0x real-time sa aming GPUs. Ang isang 1-oras na audio file ay nagtatapos sa ilalim ng 1 minuto; mas mahabang file queue at mag-notify sa pamamagitan ng email kapag tapos na.

SenseVoice ay may 234M parameter. Mas malaki modelo ay may posibilidad na maging mas tumpak ngunit mas mabagal; STT.ai host SenseVoice sa GPU kaya ang bilang ng parameter ay hindi nakakaapekto sa iyong client-side pagganap.

Ang mga format na suportado ng STT.ai ay MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, at iba pa. Ang output ay TXT, SRT, VTT, DOCX, JSON, o PDF.

Oo. Speaker diarization tumatakbo kasama SenseVoice para sa bawat transcription — bawat speaker ay may label at maaari mong palitan ang pangalan ng mga ito sa editor pagkatapos.

SenseVoice tumatakbo sa aming pinamamahalaang kapaligiran – audio ay pinoproseso at tinanggal sa pamamagitan ng default at hindi kailanman ginagamit para sa pagsasanay nang walang malinaw na opt-in. Pro plano magdagdag ng client-side encryption para sa transcripts sa pahinga.

Gamitin ang i-compare-stt tool upang patakbuhin ang SenseVoice laban sa anumang iba pang mga suportadong modelo sa parehong audio - makikita mo WER, segment count, speaker label, at kumpiyansa score side-by-side. Ang SenseVoice vs Whisper Large V3 paghahambing ay ang pinaka-karaniwang tumakbo.

Oo. tukuyin ang "sensevoice" bilang ang modelo parameter sa / v1 / transcribe endpoint. Python at Node.js SDKs isama SenseVoice halimbawa. Libreng API tier kasama ang 100 minuto / buwan.

Oo. Dahil SenseVoice ay MIT-licensed, maaari mong self-host ito. STT.ai's open-source page listahan ng proyekto repo at timbang. Karamihan sa mga koponan ng produksyon gamitin ang aming hosted na bersyon upang i-skip GPU procurement, modelo swaps, at ops.

Mag-translate sa SenseVoice

Tungkol sa SenseVoice

Mga wika na sinusuportahan ng SenseVoice

Impormasyon ng Modelo

Mga Kaugnay na Modelo

Mga Madalas Itanong

Ang SenseVoice ay isang taon sa kalendaryo.

Paano tumpak ay SenseVoice?

SenseVoice ay libre upang gamitin?

Ano ang lisensya ng SenseVoice?

Ilang wika ang suportado ng SenseVoice?

Paano mabilis ay SenseVoice?

Gaano kalaki ang SenseVoice modelo?

Ano ang audio format ay maaaring SenseVoice transcribe?

SenseVoice ay nakikita ng maraming mga nagsasalita?

Ang aking data ay pribado kapag gumagamit ng SenseVoice?

Paano SenseVoice ihambing sa iba pang mga modelo STT?

Maaari ba akong gumamit ng SenseVoice sa pamamagitan ng API?

Maaari ko bang patakbuhin SenseVoice sa aking sariling server?