Клонаванне голасу AI

Клонаваць любы голас з кароткага аўдыёкліпа. Загрузіць 3-10 секунды мовы, напісаць свой тэкст і стварыць гук у тым жа голасу.

Clone: provide a 3–10s reference clip. Preset: pick from bundled multilingual voices.
Захаваць гукавы файл
MP3, WAV, M4A, FLAC
VibeVoice presets cover English, German, French, Japanese, Korean, Polish, Portuguese, Spanish, Italian, Dutch.
Максімальна 500 знакаў
0/500
Выкарыстоўвае 1 крэдыт на пакаленне
Сгенераваны гук
Як гэта працуе
1
Загрузіць спасылку

Надаць 3- 10 секундаў чыстага гучання галасу, які вы хочаце клануць.

2
АНАЛІЗ ГОЛОСУ

F5-TTS выводзіць характарыстыкі голасу: тон, вышыня, стыль гаворкі, акцэнт.

3
Стварыць размову

Ваш тэкст будзе прамаўляцца кланаваным голасам. Загрузіць вынік як WAV.

Клонаванне голасу дазволена толькі для асабістага і аўтарызаванага выкарыстання. Не клонуйце голас без згоды голасу.

Часта задаваемыя пытанні

Upload your audio or video file to STT.ai, paste a URL, or record live. Select your preferred AI model and click Transcribe. Most files complete in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Так — STT.ai дае кожнаму наведвальніку 600 бясплатных хвілін / месяц без неабходнасці рэгістрацыі для вашага першага файла. Плацежныя планы, пачынаючы ад $ 5 / месяц, адключаюць доўгія файлы, прыватныя транскрыпты і прыярытэтную чаргу.

Дакладнасць залежыць ад мадэлі і якасці гуку. Нашы лепшыя мадэлі дасягаюць 3- 5% памылкі словаў на тэстах - 95- 97% дакладнасці на чыстым маўленні. Інструмент compare- stt дазваляе вам запусціць некалькі мадэляў на адным файле і выбраць лепшы.

STT.ai прапануе 10+ мадэляў — STT.ai Enhanced (наш самы дакладны), Whisper Large V3 (99 моў), NVIDIA Canary (#1 WER на падтрымліваемых lang), Whisper Turbo (хуткі), Moonshine (лёгкі) і іншыя.

Так. Экспартаваць ваш транскрыпт як файлы субтытраў SRT або VTT - яны працуюць з YouTube, Vimeo, TikTok, VLC і ўсімі вядомымі відэапрайгравальнікамі. Інструмент запісу субтытраў накладвае іх на відэа як жорсткія субтытры.

Так. Дыялагічная сістэма аўтаматычна падае назвы гукавых файлаў (Голас 1, Голас 2,...), і вы можаце змяніць іх назвы ў рэдактара. Гэта працуе для ўсіх мадэляў і моў.

Большасць файлаў транскрыптуецца менш чым за 5 хвілін. 1- гадзінны аўдыё файл звычайна заканчваецца за 2- 3 хвіліны на нашых найхутчэйшых мадэлях. Хуткасць залежыць ад выбару мадэлі і бягучай нагрузкі.

STT.ai падтрымлівае 20+ фарматаў уводу - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI і іншыя. Вывад у TXT, SRT, VTT, DOCX, JSON і PDF.

Дадаць файл

Так. STT.ai прапануе REST API з Python і Node.js SDK, плюс MCP сервер для Claude і Cursor. Бясплатны ўзровень API ўключае 100 хвілін / месяц.

Так. Кожны транскрыпт адкрываецца ў нашым убудаваным рэдактара, дзе вы можаце выправіць словы, змяніць назвы гукароў, змяніць час і дадаць заметкі. Усе змены захоўваюцца аўтаматычна.

Кожны запіс мае свой унікальны URL. Экспарт у DOCX або PDF для электроннай пошты. Планы Pro дадаюць захаваліся паролем і пастаянныя спасылкі - карысныя для працы з кліентамі.

STT.ai падтрымлівае 1300+ платформ, уключаючы YouTube, Vimeo, TikTok, SoundCloud і іншыя. URL-транскрыпцыя працуе толькі з публічна даступным зместам — DRM-ахоўваныя крыніцы не могуць быць транскрыптаваныя.