የድምፅ አሰጣጥ

በራስ-ሰር ለይቶ እና መለያ የተለያዩ ተናጋሪዎች በድምፅ እና ቪዲዮ ትረካዎች. ያውቁት የትኛው ምን አለ

ለሕዝብ የተቀመጠ ድምፅና ቪዲዮን ይጠቀማል. DRM-ተከላካይ ይዘት አይደገፍም

Upgrade for Enhanced
Private transcript
ፋይል (_F)
ከፕሮ ጋር አስወግዱ →
ፋይሉን እዚህ አስቀምጥ ወይም ለመዝጋት ጠቅ አድርግ
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — እስከ 2GB
Upgrade for Enhanced
Private transcript
ፋይል (_F)
ከፕሮ ጋር አስወግዱ →
Upgrade for Enhanced
ማስመዝገብ 0:00
ወቅታዊ ቅርበት ርቀት (%s)
የተሻሻለ ሹክሹክታ (ጥሩ)
የሕዝብ ግንኙነቶች: 24h, ጽሑፍ ብቻ · ምዝገባ ለ 7d + ድምፅ · ለግል ግንኙነቶች

የጊዜው ንግግር ወደ ጽሑፍ. AI እንደምትናገሩት በራሱ ይቀየራል - ትክክለኛነት በረጅም ንግግር ይሻሻላል

ሚክሮፎንዎን በመጀመሪያ ይሞግቱ
❤️ STT.aiን ወዳጅነት?
ነጻ መዝገበ ቃላትን ተጠቅመሃል

600 ደቂቃ/ወር ለመስጠት ነፃ ለመመዝገብ ወይም ለተወሰነ ጊዜ ያልተወሰነ መዝገብ ለመጨመር ይመዝገቡ።

10 ነጻ ደቂቃዎች/ቀን 600 ደቂቃዎች ነፃ የክሬዲት ካርድ የለም የተደበቀ
ነጻ →

የተናጋሪ መዝገብ ምንድን ነው?

የተናጋሪ መዝገብ ቤት የድምፅ ፍሰትን በተናጋሪው ማንነት መሠረት ወደ ክፍሎች የመከፋፈል ሂደት ነው። በነፃ ቃላት፣ "ማን የት ተናግሯል?" የሚለውን ጥያቄ መልስ ይሰጣል This is essential for multi-speaker recordings like meetings, interviews, podcasts, conference calls, and legal proceedings where knowing who said what is just as important as what was said.

STT.ai uses advanced neural speaker diarization models that can detect and label speakers in real time. The system creates speaker embeddings -- numerical representations of each voice's unique characteristics -- and clusters them to distinguish between different people. This works even when speakers have similar voices or frequently interrupt each other.

የድምፅ አሰጣጥ መፈለጊያ እንዴት እንደሚሠራ

የድምፅ እንቅስቃሴ

ሲስተሙ በመጀመሪያ የድምፅ ክፍሎችን የትኛውን ንግግር versus ድምጽ፣ ሙዚቃ ወይም የኋላ ድምፅን ያካትታል?

2. የድምፅ አዳሚ

የንግግር ክፍል ሁሉ ወደ ተናጋሪው embedding ይለወጣል - የተናጋሪው የድምፅ ባህሪያትን የሚይዝ የኮምፕሌክስ ቬክተር ነው።

3. ማሰባሰብ እና መለያ

embeddings ከአንድ ተናጋሪ ጋር ክፍሎችን ለመሰብሰብ ክስተቶች ናቸው, ከዚያ ክስተት ሁሉ መለያ ተሰጥቷል (ተናጋሪ 1, ተናጋሪ 2, ወዘተ.)

የድምፅ አሰጣጥ

የስብሰባ መዝገብ ቤት
የስብሰባ መዝገቦችን በራስ-ሰር ለእያንዳንዱ ተሳታፊ ምልክት አድርግ. የምንለውን ማን እንደተናገረው ግልጽ የሆነ ማስረጃ ያለውን መዝገብ ቤት ይፈጥሩ
የፖድካስት መዝገብ ቤት
በፖድካስት ክፍሎች ውስጥ ተቀባዮች እና እንግዶች መካከል ልዩነት. በትክክል ተናጋሪውን በመስጠት ማስታወሻዎችን ያሳዩ
የቀረበው
ለምርምር፣ ለዜና፣ ለሥራ ማስፈጸሚያ ሰነዶች የተሰጠውን የቀረበውን ጥያቄና የተሰጠውን መልስ ለይቶ ማየት
የሕግ እና የደንብ መጣስ
የምርመራ መዝገቦችን፣ የፍርድ ቤቶችን፣ የፍርድ ቤቶችንና የፍርድ ቤቶችን የግልጽነት ጥሪን በግልጽ የተናጋሪው መታወቂያ ጋር መፍጠር።

Speaker Detection on STT.ai

Speaker detection is available on all paid plans. When you transcribe audio or video with speaker detection enabled, the transcript will include speaker labels inline with the text. You can also export speaker-labeled transcripts in all supported formats including SRT, VTT, DOCX, JSON, and PDF.

Speaker 1 [00:00:01]: Welcome to the meeting, everyone. Let's start with the quarterly review. Speaker 2 [00:00:05]: Thanks. I have the numbers ready. Revenue is up 23% quarter over quarter. Speaker 1 [00:00:12]: That's great news. Can you walk us through the breakdown?

The system can detect up to 20 distinct speakers in a single recording. For best results, ensure each speaker has at least a few seconds of solo speech. Overlapping speech is handled but may reduce accuracy in heavily cross-talked segments.

የድምፅ አሰጣጥ ምርመራን አሁን ይሞክሩ

የብዙ-ተናጋሪ መዝገብ ቤትን ጫን እና ተናጋሪዎችን በራሳቸው ምልክት ያድርጉ

ነጻ

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

የድምፅ ወይም የቪዲዮ ፋይልዎን ወደ STT.ai ይጫኑ. የተሻለ AI ሞዴል እና ምርጫዎችን ይምረጡ፣ ከዚያም ይተላለፉ ይጫኑ. መተላለፊያዎ በ ደቂቃዎች ውስጥ ዝግጁ ይሆናል. እንደ TXT, SRT, VTT, DOCX, JSON ወይም PDF ይላኩ

አዎ! STT.ai ለሁሉም ተጠቃሚዎች በወር 600 ነፃ ደቂቃዎችን ይሰጣል. ለመጀመሪያው ትረካዎ ምንም መመዝገብ የለም. በተጨማሪ ደቂቃዎች እና ባህሪያት ጋር የተከፈለ ዕቅድ በ $5 / ወር ይጀምራል.

ትክክለኛነት በ AI ሞዴል እና በድምፅ ጥራት ላይ የተመሠረተ ነው. ምርጥ ሞዴሎቻችን በ 5-7% የቃል ስህተት መጠን ላይ ይደርሳሉ ፣ ማለትም 93-95% + ትክክለኛነት ነው ፡፡ የመጨረሻው ድምጽ ያለው ግልጽ ድምፅ ምርጥ ውጤቶችን ያመጣል ፡፡

STT.ai Whisper Large V3, NVIDIA Canary, እና ሌሎችን ጨምሮ 10+ ሞዴሎችን ይሰጣል. ከተለያዩ ሞዴሎች ውጤቶችን በተመሳሳይ ፋይል ላይ ማወዳደር ይችላሉ።

አዎ. ከጽፈህ በኋላ ፅፈህ እንደ SRT ወይም VTT ፋይሎች ላክ. እነዚህ በዩቲዩብ፣ በቪሜዮ እና በሁሉም ዋና የቪዲዮ መድረኮች ላይ ይሠራሉ

አዎ. STT.ai በራስ-ሰር ለይቶ እና AI ተናጋሪ diarization በመጠቀም የተለያዩ ተናጋሪዎችን መለያ ይሰጣል. በሁሉም ሞዴሎች እና ቋንቋዎች ላይ ይሠራል.

አብዛኛዎቹ ፋይሎች በ5 ደቂቃዎች ውስጥ ይተረጎማሉ. የ1 ሰዓት የድምፅ ፋይል በአብዛኛው በፍጥነት 2-3 ደቂቃዎች ይወስዳል.

STT.ai MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, እና AVI ጨምሮ 20+ ድምፅ እና ቪዲዮ ቅርጸቶች ይደግፋል. እንደ TXT, SRT, VTT, DOCX, JSON, ወይም PDF መላክ.

አዎ. የድምፅ ፋይሎች ከተጻፈ በኋላ ይሠራሉ እና ይታጠፋሉ. መረጃዎቹ ለልምምድ አይጠቀሙም. የክላይንት-ገጽ መዝገብ ቤት በሁሉም ፕሮግራሞች ላይ ነፃ ነው - የተቀመጡትን መዝገብ ቤቶች በራስዎ ብቻ ባለው ቁልፍ መዝገብ ቤት ያድርጉ. በሂደት ላይ, ሰርቨሩ ድምፅዎን በግልጽ ጽሑፍ ይይዛል. ስለ ደህንነታችን ይወቁ.

አዎ. STT.ai Python እና Node.js SDKs ጋር REST API ይሰጣል. ነፃ ደረጃ 100 ደቂቃ / ወር ያካትታል.

አዎ. STT.ai ስህተቶችን ማስተካከል፣ ተናጋሪዎችን መቀየር እና ጊዜዎችን ማስተካከል የሚችሉበት የተገጠመ የትራንስክሪፕት አርታኢን ያካትታል.

ሁሉ transcript አንድ ልዩ መውሰድ ሊንክ ያገኛል. ወደ DOCX ወይም PDF ኢሜይል ለማውጣት. Pro ዕቅዶች ሚስጢራዊ ቃል የተጠበቀ እና ዘላቂ መውሰድ ያቀርባሉ.

STT.ai ዩቲዩብ, Vimeo, TikTok, SoundCloud, እና ሌሎችም ጨምሮ 1,300 + መድረኮች ይደግፋል. URL transcription ብቻ በሕዝብ የተገኘ ድምፅ እና ቪዲዮ ጋር ይሠራል. DRM-ተከላካይ ይዘት (እንደ Spotify ፕሪሚየም ክፍሎች, Netflix, Disney +, ወዘተ) ሊተረጎም አይችልም. ለ DRM ይዘት, ፋይልን በየራሱ ያውርዱ እና ቀጥታ ያነሱት.