کړاو راپورول / د ځانتيا غوښتنه

غږونکی کشف او ښودل

په خپل ځان کې په خپل غږ او ویډیو کې مختلف غږونکي وپیژنئ او لیبل کړئ. په دقیق ډول پوه شئ چې څوک څه وویل.

د عامه لاسرسي غږيز او ويډيو کارونه. DRM-ساتل شوي مواد نه ملاتړ کيږي.

د زياتو لپاره د کچ لوړول

شخصي لېږد

سره د ليکنې سره بوختول

سره Pro کولپ →

دوتنه دلته کېښودل يا د لټول لپاره کېکاږﺉ

MP3، WAV، M4A، FLAC، MP4، MKV، MOV، WebM - تر 2GB

ګڼې دوتنې لېښل سره د پرو

د زياتو لپاره د کچ لوړول

شخصي لېږد

سره د ليکنې سره بوختول

سره Pro کولپ →

د زياتو لپاره د کچ لوړول

د متن لپاره د ریښتیني وخت وینا. AI اتومات-صحیح کوي لکه څنګه چې تاسو خبرې کوئ - دقت د اوږدې وینا سره ښه کیږي.

لومړی خپل غږيز ټيپ ازموېل

10 وړيا من / ورځ 600 دقیقې د راجستر سره وړیا هېڅ کرېډيټ کارډ کوډه کښل شوی

وړيا نوم لیکنه →

د غږ Diarization څه ده؟

د ویناوال د دایري کولو پروسه د ویناوال د هویت له مخې په برخو کې د غږیز جریان د ویشلو پروسه ده. په ساده ډول، دا د پوښتنې ځواب ورکوي "څوک کله خبرې کوي؟" This is essential for multi-speaker recordings like meetings, interviews, podcasts, conference calls, and legal proceedings where knowing who said what is just as important as what was said.

STT.ai uses advanced neural speaker diarization models that can detect and label speakers in real time. The system creates speaker embeddings -- numerical representations of each voice's unique characteristics -- and clusters them to distinguish between different people. This works even when speakers have similar voices or frequently interrupt each other.

څنګه د غږوونکي کشف کار کوي

1. د غږ د فعالیت کشف

سیسټم لومړی د غږ کومې برخې پیژني چې د خاموشۍ، موسیقي، یا پس منظر غږ پروړاندې خبرې کوي.

2. د ويناوالو Embedding

د وینا هره برخه د وینا کونکي ضمیمه کې بدلیږي - یو کمپیکٹ وکتور چې د وینا کونکي ځانګړي غږیز ځانګړتیاوې نیسي.

3. Clustering او لیبل

Embeddings د همدې غږوونکي سره د ډلې برخو ته ګروپ شوي، نو هر ګروپ ته یو لیبل ټاکل شوی (غږونکی 1، غږونکی 2، او داسې نور).

د غږوونکي کشف لپاره قضیې وکاروئ

د کتنې لېښل

په اتوماتيک ډول په غونډه کې د ثبت هر ګډونوال لیبل کړئ. د هغه چا چې څه وویل چې روښانه لقب سره دقیقې رامینځته کړئ.

پوډکاسټ لېږل

په podcast episodes کوربه او میلمانه ترمنځ توپیر. د مناسب غږونکی د ځانګړتیاوو سره د نندارتون یادونه جوړه کړئ.

مرکه

د څېړنې، ژورنالېزم، او د استخدام اسناد لپاره د مرکه کوونکي او مرکه کوونکي ځوابونه جلا کړئ.

قانوني او مطابقت

د سپارښتنو رسمي ریکارډونه، اوریدل، او د واضح غږیز پیژندلو سره د مطابقت غږونه رامینځته کړئ.

د STT.ai په اړه د غږونکي کشف

Speaker detection is available on all paid plans. When you transcribe audio or video with speaker detection enabled, the transcript will include speaker labels inline with the text. You can also export speaker-labeled transcripts in all supported formats including SRT, VTT, DOCX, JSON, and PDF.

Speaker 1 [00:00:01]: Welcome to the meeting, everyone. Let's start with the quarterly review. Speaker 2 [00:00:05]: Thanks. I have the numbers ready. Revenue is up 23% quarter over quarter. Speaker 1 [00:00:12]: That's great news. Can you walk us through the breakdown?

The system can detect up to 20 distinct speakers in a single recording. For best results, ensure each speaker has at least a few seconds of solo speech. Overlapping speech is handled but may reduce accuracy in heavily cross-talked segments.

اوس د غږوونکي کشف هڅه کول

د څو-سمونکې ثبتونه پورته او د سمونکې په خپل ځان نښه شوي وګورئ.

د وړيا ليکلو پیل کول

ډېرې پوښتنې

غږونکی کشفول ستاسو په بریښنالیک کې چلیږي: یو URL واچوئ، د فایل فایل پورته کړئ، یا د خپل میک څخه ریکارډ. STT.ai د AI ماډل غوره کوي او د 5 دقیقو لاندې د لیږد بیرته راګرځي. د TXT، SRT، VTT، DOCX، JSON، یا PDF په توګه صادر کړئ.

هو - هر لیدونکی د 600 وړیا دقیقې ترلاسه کوي ترڅو د STT.ai پیل کړي، د غږونکی کشفول لپاره کارول کیدی شي لکه څنګه چې د نورو کارونو جریان. د $ 5 / میاشتې په پیل کې د تادیې پلانونه د اوږدو فایلونو، شخصي نقلونو او لومړیتوبونو قطار کولو لپاره خلاص کړئ.

غږونکی کشفول د STT.ai پاتې برخې په څیر د AI ماډلونو کې روان دی - زموږ غوره ماډلونه د پاکې وینا (3-5٪ د کلمې غلطۍ نرخ په بینډمارکونو کې) د 95-97٪ دقیقیت ته رسیږي. د الوتنې په اړه د ماډلونو بدلول که لومړی پاس ستاسو هدف لاندې وي.

غږونکی کشفول کولی شي د STT.ai's 10 + ماډلونو څخه په کوم کې چلول شي - STT.ai زیاتوالی (ترټولو دقیق)، د ویسپر لوی V3 (99 ژبې)، NVIDIA کانری (# 1 WER په ملاتړ کې)، د ویسپر توربو (ژر)، مونشین (لنډ وزن)، او نور.

هو. هر نقل د SRT یا VTT په توګه صادروي - د یوټیوب، ویمیو، ټیک، VLC، او هر لوی ویډیو لوبغاړي سره کار کوي. د سوځولو-سیټیټونو وسیله د هارډسونو په توګه ویډیو ته وده ورکوي.

هو. د غږونکي diarization په خپل ځان کې هر غږ (غږونکی 1، غږونکی 2،...) لیبل کوي او تاسو کولی شئ په جوړ شوي سمونګر کې دوی نوم بدل کړئ. په ټولو ماډلونو او ژبو کې کار کوي.

ډیری غږونکی کشفول دندې د 5 دقیقو لاندې پای ته رسیږي. د 1 ساعت آډیو فایل معمولا زموږ د چټکو ماډلونو سره په 2-3 دقیقو کې بشپړیږي. سرعت د غوره شوي ماډل او اوسني GPU بار پورې اړه لري.

غږونکی کشفول د 20 + فارمیټونه مني - MP3، WAV، M4A، FLAC، OGG، MP4، MKV، MOV، WebM، AVI، او نور. د TXT، SRT، VTT، DOCX، JSON، یا PDF ته محصول.

هو. د آډیو فایلونه چې د غږونکی کشفول ته لیږل شوي د تل لپاره پروسس او ړنګ شوي. د پرو پلانونه د پیرودونکي اړخ کوډ کول اضافه کوي - حتی که د STT.ai ډاټا بیک اپ وي، ستاسو د لیږدولو پرته ستاسو کلیدي نه لوستل کیږي. ډاټا هیڅکله د واضح انتخاب پرته د ماډل روزنې لپاره ندي کارول شوي.

هو. STT.ai د پایټ او نوډ. جی. ایس. SDKs سره د REST API وړاندې کوي، او د کلاډ او کرسر لپاره د MCP سرور - ټول د غږونکی کشفول کار فلو لپاره کارول کیدی شي. وړیا API ټیر د 100 دقیقې / میاشت شامل دي.

هو. هر transcript په جوړ شوي مدیر کې پرانستل کیږي چیرې چې تاسو کولی شئ کلمې سم کړئ، د ویناوالو نوم بدل کړئ، timestamps تنظیم کړئ او یادونه اضافه کړئ. ټول بدلونونه په اتوماتيک ډول خوندي کړئ.

هر نقل یو ځانګړی شریک URL ترلاسه کوي. د بریښنالیک لپاره DOCX یا PDF ته صادرول. د پرو پلانونو د رمز محافظت او دائمي لینکونه اضافه کړئ - د پیرودونکي کار لپاره ګټور.

د STT.ai د 1,300+ پلیټ فارمونه اداره کوي پشمول د یوټیوب، ویمیو، ټیک ټاک، سایډکلاډ، زوم، ګوګل میټ، پوډکاسټ کوربه، او نور. د URL لیږد یوازې د عامه لاسرسي موادو سره کار کوي - د DRM محافظت شوي سرچینې نشي لیږدولی.

غږونکی کشف او ښودل

د غږ Diarization څه ده؟

څنګه د غږوونکي کشف کار کوي

1. د غږ د فعالیت کشف

2. د ويناوالو Embedding

3. Clustering او لیبل

د غږوونکي کشف لپاره قضیې وکاروئ

د STT.ai په اړه د غږونکي کشف

اوس د غږوونکي کشف هڅه کول

ډېرې پوښتنې

په STT.ai کې څنګه کار کوي غږونکی کشفول؟

وړيا دی غږونکی کشفول؟

څومره سم دی غږونکی کشفول؟

زه د غږونکی کشفول لپاره کوم AI ماډلونه کارولی شم؟

زه له غږونکی کشفول نه لاندې ليکنې ترلاسه کړم؟

.غږونکی کشفول :د بېلو غږوونکو پېژندنه کوي

څومره وخت اخلي غږونکی کشفول؟

کوم ننوت بڼې ملاتړ کوي غږونکی کشفول؟

کله چې زه غږونکی کشفول کاروم زما غږيزه غږونه پټه ده؟

.د API شتون لري غږونکی کشفول

زه وروسته د ليکنې ليکنه سمولی شم غږونکی کشفول؟

زه څنګه ونډول غواړم چې غږونکی کشفول توليدوي؟

کوم بل پلنځپټې د غږونکی کشفول نه بهر کار کوي؟