Lapor Bug / Panggonan Fitur

Transkripsi karo SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Nggawe karo audio lan video kang ana ing donya. Kandungan kang dilindhungi DRM ora didhukung.

Upgrade for Enhanced

Transkripsi pribadi

Chat karo transcript

Ditutup karo Pro →

Gunakake file iki kanggo nyalin lan nempel

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — nganti 2GB

Ngunduh sapérangan file karo Pro

Upgrade for Enhanced

Transkripsi pribadi

Chat karo transcript

Ditutup karo Pro →

Upgrade for Enhanced

Real-time speech to text. AI auto-corrects nalika sampeyan ngomong - akurasi tambah karo basa sing luwih dawa.

Uji mikrofonmu pisanan

10 menit/dina 600 min gratis karo signup Ora ana kertu kredit Dienkripsi

5.5%

WER

Basa

50.0x

Kecepatan

MIT

Lisénsi

Ngendi SenseVoice

SenseVoice iku model fondasi basa saka FunAudioLLM kang ngluwihi transkripsi. Iki nyokong 50+ basa lan kalebu kemampuan kanggo pangertèn emosi, deteksi acara audio, lan normalisasi teks invers ing siji model.

Basa kang didhukung déning SenseVoice

Inggris

Spanyol

Prancis

Jérman

Tyonghwa

Jepang

Korea

Portugis

Arab

India

Rusia

Italia

Walanda

Turki

Polandia

Swedia

Indonesia

Thailand

Vietnam

Ceska

Yunani

Rumania

Hungaria

Ibrani

Dansk

Suomi

Norwegia

Ukraina

Melayu

Bengali

Informasi Model

PanyedhiyaFunAudioLLM
Arsitektur-
LisénsiMIT
DioptimalakeMar 2026

Model sing gegandhengan

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Pitakon kang asring diajukake

STT.ai host SenseVoice ing infrastruktur GPU kita supaya sampeyan bisa nggunakake tanpa provisioning piranti lunak dhewe - upload audio utawa video lan pilih SenseVoice saka model pitcher.

Ing standar benchmarks, SenseVoice ngrampungake sekitar 5.5% Word Error Rate. Real-world akurasi gumantung ing kualitas audio, accent, lan basa; kanggo noisey utawa accented rekaman, ngarepake sawetara persentase poin luwih dhuwur WER.

SenseVoice diwiwiti ing tingkat gratis STT.ai - saben pengunjung nampa 600 menit kanggo miwiti tanpa biaya. rencana dibayar nambah watesan file sing luwih dawa, transkripsi pribadi, lan prioritas queueing.

SenseVoice dirilis ing ngisor MIT, lisensi sumber terbuka sing permisif. Sampeyan bisa nginstal SenseVoice ing piranti keras dhewe utawa nggunakake versi sing dihost - loro-loroné bisa digunakake kanthi komersial.

SenseVoice nyokong 50 basa. Auto-deteksi milih basa kang bener kanggo akèh audio; sampeyan uga bisa nyetel kanthi manual kanggo nambah akurasi.

SenseVoice ngproses audio ing kira-kira 50.0x real-time ing GPU kita. Fail audio 1 jam rampung ing ngisor 1 menit; file luwih dawa ing gulungan lan dilaporake liwat email nalika rampung.

SenseVoice duwé parameter 234M. Model kang luwih gedhé luwih akurat nanging luwih lambat; STT.ai duwé host SenseVoice ing GPU supaya penghitungan parameter ora ngrusak kinerja klien.

SenseVoice nampa saben format STT.ai nyokong - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, lan liyane. Output minangka TXT, SRT, VTT, DOCX, JSON, utawa PDF.

SenseVoice diarization speakers dijalanaken kaliyan saben transkripsi - saben speaker dipunlabel lan sampeyan saged mènèhi jeneng anyar ing editor.

Ya. SenseVoice dijalanaké ing lingkungan sing diurus — audio diproses lan dipasak kanthi pigura lan ora pernah digunakake kanggo latihan tanpa opt-in eksplisit. Rencana Pro nambah enkripsi klien-sisi kanggo transkripsi nalika ora aktif.

Gunakaké alat compare-stt kanggo nglakokaké SenseVoice karo modél liya kang didhukung ing audio kang padha — sampeyan bakal ndeleng WER, penghitung segmen, label speaker, lan skor confidence side-by-side. Perbandingan SenseVoice vs Whisper Large V3 iku sing paling umum dilakokaké.

Ya. Nyathet "sensevoice" minangka parameter model ing /v1/transcribe endpoint. Python lan Node.js SDKs ngemot conto SenseVoice. Lapisan API gratis ngemot 100 menit/wulan.

Ya. Amargi SenseVoice dipunlisensi MIT, sampeyan saged nghostaken piyambakipun. Lampiran sumber-bukah STT.ai nyathet repo proyèk lan bobot. Kathah tim produksi ingkang ngginakaken versi ingkang dipunhostaken kanggé nglewati GPU procurement, model swaps, lan ops.

Transkripsi karo SenseVoice

Ngendi SenseVoice

Basa kang didhukung déning SenseVoice

Informasi Model

Model sing gegandhengan

Pitakon kang asring diajukake

88.000 jiwa.

Kutha iki ndunungi 88.000 jiwa.

SenseVoice iku nomer atom kanggo unsur 88.

Kutha iki duwé populasi 88.000 jiwa.

SenseVoice dipundukung ing salebetipun SenseVoice basa?

Kutha iki ndunungi 88.000 jiwa.

Kutha iki duwé populasi 88.000 jiwa.

Ing taun 2000, kutha iki ndunungi 88.000 jiwa.

SenseVoice dipundeteksi kanthi multiple speakers?

Dataku pribadhi nalika aku nggunakake SenseVoice?

SenseVoice iku sawijining lintang ing rasi lintang Cetus.

SenseVoice bisa digunakaké liwat API?

SenseVoice bisa dioperasikaké ing serverku dhewe.