Transcribe with SenseVoice

Ngagunakeun audio & video anu aya di dieu. Kandungan anu dilindungi ku DRM henteu didukung.

Ningkatake kanggo Diperbaiki
Private transcript
Chat with transcript
Buka karo Pro →
Gunakake file ing kene utawa klik kanggo browse
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — nganti 2GB
Muat-up file karo Pro
Ningkatake kanggo Diperbaiki
Private transcript
Chat with transcript
Buka karo Pro →
Ningkatake kanggo Diperbaiki
Recording: 0:00
Wektu nyata Lilin (sekarang)
Dioptimalake Wisp (akurat)
Link umum: 24h, teks mung · Ndaftar for 7d + audio · Pro for private links

Parobihan basa kana teks. AI ngalereskeun otomatis nalika anjeun nyarios - akurasi naék ku kecap-kecap anu langkung panjang.

Uji mikrofonmu sadurunge
❤️ Love STT.ai? Beritahu kanca-kancamu!
Sampeyan wis nggunakake transkripsi gratis sampeyan

1000 taun ka pengker, 600 taun ka tukang, 100 taun ka tukang, 100 taun ka tukang, 100 taun ka tukang.

10 free min/day 600 min gratis karo ndhaptar Tanpa kartu kredit Dienkripsi
Daftar gratis →
5.5%
WER
50
Languages
50.0x
Speed
MIT
License

About SenseVoice

Takon-takon sing asring diajukake

STT.ai hosts SenseVoice on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick SenseVoice from the model picker.

Dina benchmarks standar, SenseVoice ngahontal kira-kira 5.5% Word Error Rate. Akurasi dunya nyata gumantung kana kualitas audio, accent, jeung basa; pikeun rekaman noisy atawa accented, ngarepkeun sababaraha poin persentase luhur WER.

SenseVoice dijalankeun dina tingkat bébas STT.ai - unggal pengunjung kéngingkeun menit / bulan 600 tanpa biaya. Rencana anu dibayar nambihan wates per file anu langkung lami, transkripsi pribadi, sareng prioritas.

SenseVoice dikaluarkeun di handapeun MIT, lisénsi sumber terbuka anu permisif. Anjeun tiasa ngahost SenseVoice dina perkakas anjeun atanapi nganggo vérsi anu dihost urang - kaduana tiasa dianggo sacara komersial.

SenseVoice ngadukung 50 basa. Auto-deteksi milih basa anu bener pikeun kabéh audio; anjeun ogé bisa nyatet éta sacara manual pikeun ngaronjatkeun akurasi.

SenseVoice ngaproses audio dina kira-kira 50.0x real-time dina GPU urang. A file audio 1 jam réngsé dina handapeun 1 menit; file leuwih panjang diulit jeung ngalaporkeun ku surél nalika réngsé.

SenseVoice mibanda parameter 234M. Model anu leuwih gedé leuwih akurat tapi leuwih lambat; STT.ai mibanda SenseVoice dina GPU supados jumlah parameter teu mangaruhan kinerja klien.

SenseVoice nampa saben format STT.ai dukungan - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, lan liya-liyane. Output minangka TXT, SRT, VTT, DOCX, JSON, utawa PDF.

Ya. Diarization speaker jalan bareng jeung SenseVoice pikeun unggal transkripsi — unggal speaker dilabelkeun sarta anjeun bisa ngaganti ngaranna dina penyunting saterusna.

Ya. SenseVoice dijalankeun dina lingkungan anu diurus urang — audio diolah sareng dihapus sacara piawai sareng henteu pernah dianggo pikeun latihan tanpa opt-in eksplisit. Rencana Pro nambahan enkripsi sisi klien pikeun transkripsi nalika istirahat.

Gunakeun alat compare-stt pikeun ngajalankeun SenseVoice ngalawan model séjén anu didukung dina audio anu sami — anjeun bakal ningali WER, jumlah segmen, label panyatur, sarta skor confidence dibarengan-dibarengan. Perbandingan SenseVoice vs Whisper Large V3 nyaéta anu paling umum dijalankeun.

Ya. Nyatakeun "sensevoice" minangka parameter model dina titik akhir /v1/transcribe. Python sareng Node.js SDK kalebet conto SenseVoice. Tingkat API gratis kalebet 100 menit / bulan.

Ya. Kusabab SenseVoice dilisensikeun ku MIT, anjeun tiasa ngahost éta nyalira. Halaman sumber terbuka STT.ai nyarankeun repo sareng beurat proyek. Kabéh tim produksi nganggo vérsi anu dihost pikeun ngaleupaskeun GPU procurement, swaps model, sareng ops.