Transcribe with SenseVoice

Əhaliyə əlçatan audio və video ilə işləyir. DRM-ə qarşı qorunan məzmun dəstəklənmir.

Enhanced üçün yüksəlt
Private transcript
Transkriptlə söhbət
Pro ilə kilidi aç →
Fayl buraya at ya da axtarmaq üçün basın
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2 Gigabayta qədər
Enhanced üçün yüksəlt
Private transcript
Transkriptlə söhbət
Pro ilə kilidi aç →
Enhanced üçün yüksəlt
Qeyd 0:00
Haqqında Vaxtı
Əlavə Fısıltısı (dəqiq)
Əhaliyə bağlantılar: 24 saat, yalnız mətn · Qeyd Et 7d + audio üçün · Pro Özəl Körpülər üçün

Rəsmi səs mətnə. AI siz danışarkən avtomatik düzəldir - uzun danışıqlarla dəqiqlik yaxşılaşır.

Əvvəlcə mikrofonu sına
❤️ STT.ai-i sevirsiniz? Dostlarınıza deyin!
Özünüzü təsdiqləyin

600 dəqiqə/ay almaq üçün pulsuz qeydiyyatdan keçin, ya da limitsiz transkripsiyalar üçün yüksəldin.

10 azad dəqiqə/gün 600 min min qeydiyyatla pulsuz Kredit kartı yoxdur Şifrələnmişdir
Qeydiyyatdan keç →
5.5%
WER
50
Languages
50.0x
Speed
MIT
License

About SenseVoice

Tez-tez Sorulan Sual

SenseVoice FunAudioLLM tərəfindən səs-mətn modeldir. STT.ai SenseVoice-i GPU infrastrukturumuzda yerləşdirir, buna görə də siz onu öz hardverinizi təmin etmədən istifadə edə bilərsiniz - audio və ya video yükləyin və SenseVoice-i model seçicisindən seçin.

Standart benchmarklarda SenseVoice 5.5% söz səhv dərəcəsinə nail olur. Real dünya doğruluğu səs keyfiyyətinə, aksenta və dilinə bağlıdır; səsli və aksentli qeydlər üçün bir neçə faiz daha yüksək WER gözləyin.

SenseVoice STT.ai-in pulsuz səviyyəsində işləyir - hər ziyarətçi ayda 600 dəqiqə pulsuz əldə edir. Ödənişli planlar daha uzun fayl limitləri, şəxsi transkriptlər və prioritet sıralama əlavə edir.

SenseVoice MIT, bir açıq mənbə lisenziyası altında buraxılır. Siz SenseVoice-i öz hardverinizdə öz-özünə yerləşdirə bilərsiniz ya da bizim yerləşdirdiyimiz versiyası ilə istifadə edə bilərsiniz - hər ikisi də kommersiya üçün istifadə edilə bilər.

SenseVoice 50 dillərini dəstəkləyir. Avtomatik aşkarlama səsin çoxu üçün doğru dili seçir; siz onu əllə də müəyyən edə bilərsiniz.

SenseVoice audionu GPU-larda 50.0x real vaxtla işləyir. 1 saatlıq audio fayl 1 dəqiqə ərzində bitər; daha uzun fayllar növbəyə qoyularaq bitdikdə e-poçtla xəbərdar edilir.

SenseVoice-in 234M parametrləri var. Böyük modellər daha dəqiq, lakin daha yavaşdır; STT.ai GPU-da SenseVoice-i qəbul edir, buna görə də parametrlərin sayı sizin klient tərəfi performansınızı təsir etmir.

SenseVoice STT.ai-in dəstəklədiyi hər formatı qəbul edir — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI və digərləri. Çıxış TXT, SRT, VTT, DOCX, JSON və ya PDF olaraq.

Bəli. Hər bir transkripsiya üçün SenseVoice ilə birlikdə səsləndiricinin diarizasiyası işləyir - hər bir səsləndirici etiketlənir və sonradan redaktorda onları yenidən adlandıra bilərsiniz.

Bəli. SenseVoice bizim idarə olunan mühitimizdə işləyir - səs əvvəlcədən işlənir və silinir və heç vaxt açıqca razılaşmadan təlim üçün istifadə edilmir. Pro planları istirahətdə olan transkriptlər üçün müştəri tərəfli şifrələməyi əlavə edir.

SenseVoice-i eyni səsdə digər dəstəklənən modellərlə müqayisə etmək üçün compare-stt alətini istifadə et - siz WER, segment sayını, səsləndirici etiketlərini və etibarlılıq ballarını yan-yana görəcəksiniz. SenseVoice vs Whisper Large V3 müqayisəsi ən çox işlənəndir.

Bəli. /v1/transcribe son nöqtəsində model parametri olaraq "sensevoice" göstərin. Python və Node.js SDK-ları SenseVoice nümunələrini ehtiva edir. Pulsuz API səviyyəsi ayda 100 dəqiqəni ehtiva edir.

Bəli. SenseVoice MIT-licensiyalıdır, buna görə də onu öz-özünə yerləşdirə bilərsiniz. STT.ai-in açıq mənbə səhifəsində layihənin repozitoriyası və çəkiləri göstərilir. Çox istehsal qrupları GPU satınalmalarını, model dəyişmələrini və əməliyyatları keçmək üçün bizim yerləşdirilmiş versiyamızı istifadə edirlər.