Transcribe with SenseVoice

Nggawe karo audio lan video kang ana ing donya. Kandungan kang dilindhungi DRM ora didhukung.

Upgrade for Enhanced
Private transcript
Chat karo transcript
Ditutup karo Pro →
Gunakake file iki kanggo nyalin lan nempel
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — nganti 2GB
Upgrade for Enhanced
Private transcript
Chat karo transcript
Ditutup karo Pro →
Upgrade for Enhanced
Rekaman: 0:00
Real-time Lilin (seda)
Dioptimalake Wiwit iku (ing basa Jawa)
24 jam, 24 jam, 24 jam, 24 jam, 24 jam. · Langganan kanggo 7d + audio · Pro for private links

Real-time speech to text. AI auto-corrects nalika sampeyan ngomong - akurasi tambah karo basa sing luwih dawa.

Uji mikrofonmu pisanan
❤️ STT.ai? Nyathet kanca-kancamu!
Sampeyan wis nggunakake transkripsi gratis sampeyan

Ing taun 1996, dhèwèké gabung karo grup musik 600 Minutes, lan wiwit main ing acara-acara hiburan.

10 menit/dina 600 min gratis karo signup Ora ana kertu kredit Dienkripsi
Sign up free →
5.5%
WER
50
Languages
50.0x
Speed
MIT
License

About SenseVoice

Pitakon kang asring diajukake

STT.ai host SenseVoice ing infrastruktur GPU kita supaya sampeyan bisa nggunakake tanpa provisioning piranti lunak dhewe - upload audio utawa video lan pilih SenseVoice saka model pitcher.

Ing standar benchmarks, SenseVoice ngrampungake sekitar 5.5% Word Error Rate. Real-world akurasi gumantung ing kualitas audio, accent, lan basa; kanggo noisey utawa accented rekaman, ngarepake sawetara persentase poin luwih dhuwur WER.

SenseVoice dioperasikaké ing tingkat gratis STT.ai - saben pengunjung nampa 600 menit / wulan tanpa biaya. rencana dibayar nambah watesan per-file sing luwih dawa, transkripsi pribadi, lan prioritas queueing.

SenseVoice dirilis ing ngisor MIT, lisensi sumber terbuka sing permisif. Sampeyan bisa nginstal SenseVoice ing piranti keras dhewe utawa nggunakake versi sing dihost - loro-loroné bisa digunakake kanthi komersial.

SenseVoice nyokong 50 basa. Auto-deteksi milih basa kang bener kanggo akèh audio; sampeyan uga bisa nyetel kanthi manual kanggo nambah akurasi.

SenseVoice ngproses audio ing kira-kira 50.0x real-time ing GPU kita. Fail audio 1 jam rampung ing ngisor 1 menit; file luwih dawa ing gulungan lan dilaporake liwat email nalika rampung.

SenseVoice duwé parameter 234M. Model kang luwih gedhé luwih akurat nanging luwih lambat; STT.ai duwé host SenseVoice ing GPU supaya penghitungan parameter ora ngrusak kinerja klien.

SenseVoice nampa saben format STT.ai nyokong - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, lan liyane. Output minangka TXT, SRT, VTT, DOCX, JSON, utawa PDF.

SenseVoice diarization speakers dijalanaken kaliyan saben transkripsi - saben speaker dipunlabel lan sampeyan saged mènèhi jeneng anyar ing editor.

Ya. SenseVoice dijalanaké ing lingkungan sing diurus — audio diproses lan dipasak kanthi pigura lan ora pernah digunakake kanggo latihan tanpa opt-in eksplisit. Rencana Pro nambah enkripsi klien-sisi kanggo transkripsi nalika ora aktif.

Gunakaké alat compare-stt kanggo nglakokaké SenseVoice karo modél liya kang didhukung ing audio kang padha — sampeyan bakal ndeleng WER, penghitung segmen, label speaker, lan skor confidence side-by-side. Perbandingan SenseVoice vs Whisper Large V3 iku sing paling umum dilakokaké.

Ya. Nyathet "sensevoice" minangka parameter model ing /v1/transcribe endpoint. Python lan Node.js SDKs ngemot conto SenseVoice. Lapisan API gratis ngemot 100 menit/wulan.

Ya. Amargi SenseVoice dipunlisensi MIT, sampeyan saged nghostaken piyambakipun. Lampiran sumber-bukah STT.ai nyathet repo proyèk lan bobot. Kathah tim produksi ingkang ngginakaken versi ingkang dipunhostaken kanggé nglewati GPU procurement, model swaps, lan ops.