AI आवाज क्लोनर

छोटो अडियो क्लिपबाट कुनै पनि आवाज क्लोन गर्नुहोस्। भाषणको ३-१० सेकेन्ड अपलोड गर्नुहोस्, तपाईँको पाठ टाइप गर्नुहोस्, र उही आवाजमा अडियो उत्पन्न गर्नुहोस्।

Clone: provide a 3–10s reference clip. Preset: pick from bundled multilingual voices.
आवाज सन्दर्भ अडियो अपलोड गर्नुहोस्
MP3, WAV, M4A, FLAC
VibeVoice presets cover English, German, French, Japanese, Korean, Polish, Portuguese, Spanish, Italian, Dutch.
अधिकतम ५०० क्यारेक्टर
0/500
प्रति पुस्ता १ क्रेडिट प्रयोग गर्दछ
उत्पन्न अडियो
यो कसरी काम गर्दछ
1
सन्दर्भ अपलोड गर्नुहोस्

3-10 सेकेन्ड स्पष्ट भाषणको आवाज प्रदान गर्नुहोस् जुन तपाईं क्लोन गर्न चाहनुहुन्छ।

2
AI ले आवाज विश्लेषण गर्दछ

F5-TTS आवाज विशेषताहरू निकाल्छ: टोन, पिच, बोल्ने शैली, उच्चारण।

3
भाषण सिर्जना गर्नुहोस्

तपाईँको पाठ क्लोन गरिएको आवाजमा बोलेको छ । परिणाम WAV को रूपमा डाउनलोड गर्नुहोस् ।

आवाज क्लोनिङ व्यक्तिगत र अनुमति प्राप्त प्रयोगका लागि मात्र हो । वक्ताको अनुमति बिना आवाजहरू क्लोन नगर्नुहोस् ।

प्राय सोधिने प्रश्नहरू

STT.ai मा आफ्नो अडियो वा भिडियो फाइल अपलोड गर्नुहोस्, यूआरएल टाँस्नुहोस्, वा प्रत्यक्ष रेकर्ड गर्नुहोस्। आफ्नो मनपर्ने एआई मोडेल चयन गर्नुहोस् र प्रतिलिपि गर्नुहोस् क्लिक गर्नुहोस्। अधिकांश फाइलहरू5मिनेटमा पूरा हुन्छन्। TXT, SRT, VTT, DOCX, JSON, वा PDF को रूपमा निर्यात गर्नुहोस्।

हो - STT.ai प्रत्येक आगन्तुकलाई 600 नि: शुल्क मिनेट / महिना दिन्छ जुन तपाईंको पहिलो फाइलको लागि आवश्यक छैन। भुक्तानी योजनाहरू $5/month मा सुरु हुन्छ लामो फाइलहरू, निजी प्रतिलिपिहरू, र प्राथमिकता कतार खोल्नुहोस्।

सटीकता मोडेल र अडियो गुणस्तरमा निर्भर गर्दछ। हाम्रो सर्वश्रेष्ठ मोडेलहरू बेन्चमार्कहरूमा 3-5% शब्द त्रुटि दरमा पुग्छन् - 95-97% सफा भाषणमा सटीकता। तुलना-STT उपकरणले तपाईंलाई एउटै फाइलमा धेरै मोडेलहरू चलाउन र उत्तम एक चयन गर्न अनुमति दिन्छ।

STT.ai प्रस्ताव 10+ मोडेल - STT.ai बढाइएको (हाम्रो सबैभन्दा सटीक), Whisper ठूलो V3 (99 भाषाहरू), NVIDIA क्यानरी (#1 समर्थित langs मा WER), Whisper टर्बो (फास्ट), Moonshine (लाइटवेट), र थप. प्रत्येक मोडेल पृष्ठ विवरण छ.

हो। SRT वा VTT उपशीर्षक फाइलहरूको रूपमा आफ्नो अनुक्रमणिका निर्यात गर्नुहोस् - तिनीहरूले यूट्यूबसँग काम गर्दछ, Vimeo, TikTok, VLC, र हरेक प्रमुख भिडियो प्लेयर। बर्न-उपशीर्षक उपकरणले हार्डसुबहरूको रूपमा भिडियोमा ओभरले गर्दछ।

हो । वक्ता डायराइजेसनले स्वचालित रूपमा प्रत्येक आवाज ( वक्ता १, वक्ता २,...) लेबुल गर्दछ र तपाईँले तिनीहरूलाई सम्पादकमा पुन: नामकरण गर्न सक्नुहुन्छ । सबै नमूना र भाषाहरूमा काम गर्दछ ।

अधिकांश फाइलहरू5मिनेटमा अनुक्रमित हुन्छन्। एक 1-घण्टा अडियो फाइल सामान्यतया हाम्रो छिटो मोडेलहरूसँग 2-3 मिनेटमा समाप्त हुन्छ। गति मोडेलको विकल्प र हालको लोडमा निर्भर गर्दछ।

STT.ai समर्थन 20+ आगत ढाँचा - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI र अन्य. TXT गर्न निर्गत, SRT, VTT, DOCX, JSON, र PDF.

हो। अडियो फाइलहरू पूर्वनिर्धारित रूपमा प्रक्रिया र मेटिएका छन्। प्रो योजनाहरू क्लाइन्ट-साइड गुप्तिकरण थप्नुहोस् - हाम्रो डेटाबेस तोडिएको भए पनि, तपाईंको लिखित प्रतिहरू तपाईंको कुञ्जी बिना पढ्न योग्य छैनन्। डेटा स्पष्ट विकल्प-इन बिना मोडेल प्रशिक्षणको लागि कहिल्यै प्रयोग गरिएको छैन।

हो। STT.ai पाइथन र Node.js SDKs संग एक REST API प्रस्ताव, साथै क्लाउड र कर्सर को लागि एक एमसीपी सर्भर। नि: शुल्क एपीआई तह 100 मिनेट / महिना समावेश गर्दछ।

हो. हरेक transcript तपाईं सही शब्दहरू गर्न सक्नुहुन्छ जहाँ हाम्रो निर्माण सम्पादक मा खोल्छ, वक्ताहरू पुन: नामकरण, timestamps समायोजन, र द्रष्टव्य थप्न. सबै परिवर्तनहरू स्वचालित बचत.

प्रत्येक transcript एक अद्वितीय shareable यूआरएल प्राप्त. ईमेल लागि DOCX वा PDF निर्यात. प्रो योजनाहरू पासवर्ड-रक्षक र स्थायी लिङ्क थप्नुहोस् - ग्राहक काम लागि उपयोगी.

STT.ai समर्थन 1,300+ युट्यूब, Vimeo, TikTok, SoundCloud, र अधिक सहित प्लेटफर्महरू। यूआरएल प्रतिलिपि केवल सार्वजनिक रूपमा उपलब्ध सामग्रीसँग काम गर्दछ - डीआरएम-सुरक्षित स्रोतहरू प्रतिलिपि गर्न सकिँदैन।