AI balss klons
Apvienojiet jebkuru balsi no īsa audio klipa. Ielādējiet 3-10 sekundes runas, ierakstiet tekstu un ģenerējiet audio vienā balsī.
Clone: provide a 3–10s reference clip. Preset: pick from bundled multilingual voices.
Augšupielādēt balss atsauces audio
MP3, WAV, M4A, FLAC
VibeVoice presets cover English, German, French, Japanese, Korean, Polish, Portuguese, Spanish, Italian, Dutch.
Ne vairāk kā 500 rakstzīmju
0/500
Izmanto 1 kredītu vienai paaudzei
Kā tas notiek
1
Augšupielādēt atsauci
Nodrošiniet 3-10 sekundes skaidru runu no balss vēlaties klonēt.
2
AI analizē balsi
F5-TTS ekstrakti balss īpašības: tonis, piķis, runājošais stils, akcents.
3
Ģenerēt runu
Jūsu teksts ir runāts klonētā balsī. Lejupielādēt rezultātu kā WAV.
Balss klonēšana ir paredzēta tikai personīgai un autorizētai lietošanai. Neklodē balsis bez runātāja piekrišanas.
Bieži uzdoti jautājumi
Ielādējiet audio vai video failu uz STT.ai, ielīmējiet URL vai ierakstiet tiešraidē. Izvēlieties jūsu vēlamo AI modeli un noklikšķiniet uz Atšifrēt. Lielākā daļa failu pabeigti pēc 5 minūtēm. Eksportējiet kā TXT, SRT, VTT, DOCX, JSON vai PDF.
Jā — STT.ai dod katram apmeklētājam 600 bezmaksas minūtes/mēnesi bez pierakstīšanās, kas nepieciešama jūsu pirmajam failam. Maksātie plāni sākas ar $ 5 mēnešu atbloķēt ilgākus failus, privātus transkriptus un prioritāro rindu.
Precizitāte ir atkarīga no modeļa un audio kvalitātes. Mūsu labākie modeļi sasniedz 3-5% Word Error Rate on fundamentals — 95-97% precizitāte par tīru runu. Salīdzināt-stt rīks ļauj jums palaist vairākus modeļus uz to pašu failu un izvēlēties labāko.
STT.ai piedāvā 10+ modeļus — STT.ai Pastiprināts (mūsu visprecīzākais), Whisper Liels V3 (99 valodas), NVIDIA Canary (#1 WER uz atbalsta langs), Whisper Turbo (ast), Moonshine (viegls svars) un vairāk. Katrā modeļa lapā ir informācija.
Jā. Eksportējiet savu transkriptu kā SRT vai VTT apakšvirsrakstu failus — viņi strādā ar YouTube, Vimeo, TikTok, VLC un katru galveno video atskaņotāju. Sadedzināšanas apakšvirsraksti rīks tos pārklāj uz video kā cieto subs.
Jā. Skaļruņa diarizācija automātiski iezīmē katru balsi (Runātājs 1, Skaļrunis 2,...) un jūs varat pārdēvēt tos redaktorā. Darbojas visos modeļos un valodās.
Lielākā daļa failu tiek pārraidīti pēc 5 minūtēm. 1 stundas audio fails parasti beidzas 2-3 minūtēs ar mūsu ātrākajiem modeļiem. Ātrums ir atkarīgs no modeļa izvēles un pašreizējās slodzes.
STT.ai atbalsta 20+ ievades formātus — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI un citus. Izvade uz TXT, SRT, VTT, DOCX, JSON un PDF.
Jā. Audio faili tiek apstrādāti un izdzēsti pēc noklusējuma. Pro plāni pievienot klientu-side šifrēšana — pat ja mūsu datu bāze ir bojāta, jūsu transkripti ir nelasāmi bez jūsu atslēgas. Dati nekad netiek izmantoti modeļu apmācībai bez skaidras opt-in.
Jā. STT.ai piedāvā REST API ar Python un Node.js SDK, plus MCP serveris Claude un Cursor. Bezmaksas API līmenis ietver 100 minūtes/mēnesī.
Jā. Katrs transkripts atveras mūsu iebūvētajā redaktorā, kur jūs varat labot vārdus, pārdēvēt runātājus, pielāgot laika zīmogus un pievienot piezīmes. Visas izmaiņas saglabāt automātiski.
Katrs transkripts saņem unikālu koplietojamu URL. Eksportēt uz DOCX vai PDF e-pastam. Pro plāni pievienot paroles aizsargātas un pastāvīgas saites — noderīgas klienta darbam.
STT.ai atbalsta 1,300+ platformas, tostarp YouTube, Vimeo, TikTok, SoundCloud un citas. URL transkripcija darbojas tikai ar publiski pieejamu saturu — DRM aizsargātus avotus nevar pārrakstīt.