ក្លូនសំឡេង AI
ក្លូនសំឡេងណាមួយពីចន្លោះអូឌីយ៉ូខ្លី ។ ផ្ទុកឡើង 3-10 វិនាទីនៃការនិយាយ វាយអត្ថបទរបស់អ្នក និងបង្កើតអូឌីយ៉ូក្នុងសំឡេងដូចគ្នា ។
Clone: provide a 3–10s reference clip. Preset: pick from bundled multilingual voices.
ផ្ទុកអូឌីយ៉ូយោងសំឡេងឡើង
MP3, WAV, M4A, FLAC
VibeVoice presets cover English, German, French, Japanese, Korean, Polish, Portuguese, Spanish, Italian, Dutch.
៥០០ តួអក្សរអតិបរមា
0/500
ប្រើ ១ ពិន្ទុក្នុងមួយជំនាន់
របៀបដែលវាធ្វើការ
1
ផ្ទុកសេចក្ដីយោងឡើង
ផ្ដល់ការនិយាយច្បាស់ 3- 10 វិនាទីពីសំឡេងដែលអ្នកចង់ក្លូន & # 160; ។
2
AI វិភាគសំឡេង
F5- TTS ដកលក្ខណៈពិសេសសំឡេងចេញ & # 160; ៖ សំឡេង កម្រិតសំឡេង រចនាប័ទ្មនិយាយ សំឡេង accent & # 160; ។
3
បង្កើតការនិយាយ
អត្ថបទរបស់អ្នកត្រូវបាននិយាយក្នុងសំឡេងក្លូន & # 160; ។ ទាញយកលទ្ធផលជា WAV & # 160; ។
ការក្លូនសំឡេងគឺសម្រាប់តែការប្រើផ្ទាល់ខ្លួន និងបានអនុញ្ញាតប៉ុណ្ណោះ & # 160; ។ កុំក្លូនសំឡេងដោយគ្មានការយល់ព្រមរបស់អ្នកនិយាយ & # 160; ។
សំណួរដែលសួរញឹកញាប់
ផ្ទុកឡើងឯកសារអូឌីយ៉ូឬវីដេអូរបស់អ្នកទៅ STT.ai បិទភ្ជាប់ URL ឬថតបន្តផ្ទាល់។ ជ្រើសម៉ូដែល AI ដែលអ្នកចូលចិត្តហើយចុច ចម្លង។ ឯកសារភាគច្រើនត្រូវបានបញ្ចប់ក្នុងរយៈពេល5នាទី។ នាំចេញជា TXT, SRT, VTT, DOCX, JSON ឬ PDF ។
បាទ - STT.ai ផ្តល់ឱ្យអ្នកទស្សនាទាំងអស់ 600 នាទី / ខែដោយឥតគិតថ្លៃដោយគ្មានការចុះឈ្មោះដែលត្រូវការសម្រាប់ឯកសារដំបូងរបស់អ្នក. ផែនការដែលបានបង់ចាប់ផ្តើមនៅ $5 / ខែបើកឯកសារវែងជាងនេះ, ឯកសារចម្លងឯកជននិងជួរអាទិភាព.
ភាពត្រឹមត្រូវអាស្រ័យលើម៉ូដែលនិងគុណភាពអូឌីយ៉ូ។ ម៉ូដែលល្អបំផុតរបស់យើងឈានដល់អត្រាកំហុសពាក្យ 3-5% លើចំណុចប្រទាក់ - 95-97% ភាពត្រឹមត្រូវលើការនិយាយស្អាត។ ឧបករណ៍ប្រៀបធៀប-stt អនុញ្ញាតឱ្យអ្នករត់ម៉ូដែលច្រើននៅលើឯកសារដូចគ្នាហើយជ្រើសយកមួយល្អបំផុត។
STT.ai ផ្តល់ជូន 10+ ម៉ូដែល - STT.ai បង្កើន (ត្រឹមត្រូវបំផុតរបស់យើង), Whisper ធំ V3 (99 ភាសា), NVIDIA Canary (#1 WER លើ langs គាំទ្រ), Whisper Turbo (លឿន), Moonshine (ទម្ងន់ស្រាល), និងច្រើនទៀត. ទំព័រម៉ូដែលនីមួយៗមានលម្អិត.
បាទ. នាំចេញការបកប្រែរបស់អ្នកជាឯកសារចំណងជើងរង SRT ឬ VTT - ពួកគេធ្វើការជាមួយ YouTube, Vimeo, TikTok, VLC, និងកម្មវិធីចាក់វីដេអូធំៗទាំងអស់. ឧបករណ៍ចំណងជើងរងដុតពួកគេលើវីដេអូជា hardsubs.
បាទ/ ចាស & # 160; ។ ការកំណត់ទិនានុប្បវត្តិអ្នកនិយាយដាក់ស្លាកសំឡេងនីមួយៗដោយស្វ័យប្រវត្តិ (អ្នកនិយាយ ១ អ្នកនិយាយ ២...) ហើយអ្នកអាចប្ដូរឈ្មោះពួកវាក្នុងកម្មវិធីនិពន្ធ & # 160; ។ ធ្វើការលើម៉ូដែល និងភាសាទាំងអស់ & # 160; ។
ឯកសារភាគច្រើនត្រូវបានបកប្រែក្នុងរយៈពេល5នាទី។ ឯកសារអូឌីយ៉ូ 1 ម៉ោងជាធម្មតាបញ្ចប់ក្នុងរយៈពេល 2-3 នាទីជាមួយម៉ូដែលលឿនបំផុតរបស់យើង។ ល្បឿនអាស្រ័យលើជម្រើសម៉ូដែលនិងផ្ទុកបច្ចុប្បន្ន។
STT.ai គាំទ្រ 20+ ទ្រង់ទ្រាយបញ្ចូល - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI និងអ្នកផ្សេងទៀត។ លទ្ធផលទៅ TXT, SRT, VTT, DOCX, JSON, និង PDF ។
បាទ. ឯកសារអូឌីយ៉ូត្រូវបានដំណើរការនិងលុបដោយលំនាំដើម. ផែនការ Pro បន្ថែមការអ៊ិនគ្រីបផ្នែកម៉ាស៊ីនភ្ញៀវ - ទោះបីជាមូលដ្ឋានទិន្នន័យរបស់យើងត្រូវបានរំលោភ, ចម្លងរបស់អ្នកគឺមិនអាចអានបានដោយគ្មានសោរបស់អ្នក. ទិន្នន័យមិនត្រូវបានប្រើសម្រាប់ម៉ូដែលបណ្តុះបណ្តាលដោយគ្មានការបញ្ជាក់ opt-in.
បាទ។ STT.ai ផ្តល់ជូននូវ API REST ជាមួយ Python និង Node.js SDKs បន្ថែមពីលើម៉ាស៊ីនបម្រើ MCP សម្រាប់ Claude និងទស្សន៍ទ្រនិច។ កម្រិត API ឥតគិតថ្លៃរួមបញ្ចូលទាំង 100 នាទី / ខែ។
បាទ. អត្ថបទសរសេរឡើងវិញទាំងអស់បើកក្នុងកម្មវិធីនិពន្ធដែលបានបង្កប់របស់យើងដែលអ្នកអាចកែពាក្យ ប្ដូរឈ្មោះអ្នកនិយាយ កែសម្រួលត្រាពេលវេលា និងបន្ថែមចំណាំ ។ ការផ្លាស់ប្ដូរទាំងអស់រក្សាទុកដោយស្វ័យប្រវត្តិ ។
រាល់ transcript ទទួលបាន URL ចែករំលែកតែមួយគត់. នាំចេញទៅ DOCX ឬ PDF សម្រាប់អ៊ីម៉ែល. ផែនការ Pro បន្ថែមតំណដែលការពារដោយពាក្យសម្ងាត់និងជានិច្ច - មានប្រយោជន៍សម្រាប់ការងាររបស់អតិថិជន.
STT.ai គាំទ្រ 1,300+ វេទិការួមទាំង YouTube, Vimeo, TikTok, SoundCloud, និងច្រើនទៀត។ ការបកប្រែ URL ធ្វើការជាមួយមាតិកាដែលអាចរកបានសម្រាប់សាធារណជនប៉ុណ្ណោះ - ប្រភពដែលការពារដោយ DRM មិនអាចត្រូវបានបកប្រែ។