Canfod a Diareiddio Serydd

Dynodi a labelu siaradwyr gwahanol yn eich trosysgrifiadau sain a fideo yn awtomatig. Gwybod yn union pwy ddywedodd beth.

Works with publicly available audio & video. DRM-protected content is not supported.

Upgrade for Enhanced
Private transcript
Sgwrsio gyda throsglwyddiad
Datgloi gyda Pro →
Rholio ffeil yma neu glicio i bori
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - hyd at 2GB
Upgrade for Enhanced
Private transcript
Sgwrsio gyda throsglwyddiad
Datgloi gyda Pro →
Upgrade for Enhanced
Recordio: 0:00
Amser real Cerrig (amserol)
Uwch Chwiban (cyson)
Cyswllt cyhoeddus: 24 awr, testun yn unig · Cofrestru ar gyfer 7d + sain · Proffesiynol am gysylltiadau preifat

Llythrennedd amser real i destun. Mae AI yn cywiro'n awtomatig wrth i chi siarad - mae cywirdeb yn gwella gyda llais hirach.

Arbrofi eich meicroffon yn gyntaf
❤️ Hoffwch STT.ai? Meddwl am eich ffrindiau!
Rydych wedi defnyddio eich trosysgrifiadau am ddim

Cofrestru am ddim i gael 600 munud/mis, neu uwchraddio am drosysgrifiadau diderfyn.

10 munud rhydd/diwrnod 600 munud am ddim gyda chofrestru Dim cerdyn credyd Wedi' i amgryptio
Cofrestru am ddim →

Beth yw Diareiddio'r Seinydd?

Y broses o rannu llif sain i rannau yn ôl dynodiad y siaradwr yw diareiddio siaradwr. Yn eiriau symlach, mae'n ateb y cwestiwn "pwy oedd yn siarad pryd?" This is essential for multi-speaker recordings like meetings, interviews, podcasts, conference calls, and legal proceedings where knowing who said what is just as important as what was said.

STT.ai uses advanced neural speaker diarization models that can detect and label speakers in real time. The system creates speaker embeddings -- numerical representations of each voice's unique characteristics -- and clusters them to distinguish between different people. This works even when speakers have similar voices or frequently interrupt each other.

Sut mae Canfod Seryddwyr yn Gweithio

1. Canfod Gweithrediad Llygaid

Mae'r system yn adnabod yn gyntaf pa rannau o sain sy'n cynnwys siarad yn erbyn distawrwydd, cerddoriaeth, neu sŵn cefndir.

2. Mewnosod Serydd

Mae pob rhan o'r siarad yn cael ei throsi i mewnosod seicolegydd -- fector cywasgedig sy'n dal nodweddion sain unigryw'r siaradwr.

Cylchdroi

Mae mewnosodiadau yn cael eu clymu i grwpio segmentau o' r un siaradwr ynghyd, ac yna mae label yn cael ei neilltuo i bob clymu (Sgwrsydd 1, Sgwrsydd 2, ac ati).

Cysylltiad 01Name

Trawssgrifiad Cyfarfod
Labelu pob cyfrannwr yn ysgrifenedig yn y recordiadau cyfarfodydd yn ymysgogol. Creu cofnodion gydag enwau'r rhai a ddywedodd beth yn glir.
Trawsnewid Podiau
Gwahaniaethu rhwng gwesteiwr a gwestai mewn podlediadau. Creu nodiadau dangos gyda dynodi siaradwr cywir.
Trawssgrifiad Ymateb
Ail-enwi ymatebion cyfwelydd a chyfwelydd ar wahân ar gyfer ymchwil, newyddion, a dogfennaeth cyflogi.
Cyfraith a Chyflawni
Creu cofnodion swyddogol o ddatganiadau, gwrandawiadau, a galwadau cydymffurfio gydag adnabod siaradwr clir.

Canfod Serydd ar STT.ai

Speaker detection is available on all paid plans. When you transcribe audio or video with speaker detection enabled, the transcript will include speaker labels inline with the text. You can also export speaker-labeled transcripts in all supported formats including SRT, VTT, DOCX, JSON, and PDF.

Speaker 1 [00:00:01]: Welcome to the meeting, everyone. Let's start with the quarterly review. Speaker 2 [00:00:05]: Thanks. I have the numbers ready. Revenue is up 23% quarter over quarter. Speaker 1 [00:00:12]: That's great news. Can you walk us through the breakdown?

The system can detect up to 20 distinct speakers in a single recording. For best results, ensure each speaker has at least a few seconds of solo speech. Overlapping speech is handled but may reduce accuracy in heavily cross-talked segments.

Ceisiwch ganfod y siaradwr nawr

Llwytho recordiad aml-seinydd i fyny a gweld y seinydd yn cael eu labelu'n awtomatig.

Cychwyn Trosysgrifo Am Ddim

Cwestiynau a Ofynnir yn Aml

Llwythwch eich ffeil sain neu fideo i STT.ai. Dewiswch eich model a dewisiadau AI hoff, ac yna cliciwch Trawssgrifo. Bydd eich trosglwyddiad yn barod mewn munudau. Allforio fel TXT, SRT, VTT, DOCX, JSON, neu PDF.

Ie! Mae STT.ai yn cynnig 600 munud am ddim bob mis i bob defnyddiwr. Nid oes angen cofrestru ar gyfer eich trosglwyddiad cyntaf. Mae cynlluniau talu gyda mwy o funudau a nodweddion yn dechrau ar $5/mis.

Mae cywirdeb yn dibynnu ar y model AI rydych yn ei ddewis a'r ansawdd sain. Mae ein modelau gorau yn cyrraedd Cyfradd Gwallau Geiriau o 5-7% ar feini prawf, sy'n golygu cywirdeb o 93-95%. Mae sain glir gyda lleiafswm o sŵn cefndir yn cynhyrchu'r canlyniadau gorau.

Mae STT.ai yn cynnig 10+ model gan gynnwys Whisper Large V3, NVIDIA Canary, a mwy. Gallwch gymharu canlyniadau o wahanol fathau ar yr un ffeil.

Ydy. Ar ôl trosysgrifo, allforiwch eich trosysgrif fel ffeiliau isdeitlau SRT neu VTT. Mae'r rhain yn gweithio gyda YouTube, Vimeo, a phob platfform fideo mawr.

Ie. Mae STT.ai yn adnabod a labelu siaradwyr gwahanol yn awtomatig gan ddefnyddio diareiddio siaradwyr AI. Gweithreda ar draws pob model ac iaith.

Mae'r rhan fwyaf o ffeiliau yn cael eu trosysgrifo mewn llai na 5 munud. Mae ffeil sain 1 awr yn cymryd 2-3 munud yn gyffredinol gyda'n modelau cyflymaf.

STT.ai supports 20+ audio and video formats including MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, and AVI. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Ydy. Mae ffeiliau sain yn cael eu prosesu a'u dileu ar ôl trosysgrifo. Ni ddefnyddir eich data erioed ar gyfer hyfforddi. Mae cêl- ysgrifennu ochr y cleient am ddim ar bob cynllun — mae'n cêl- ysgrifo trosysgrifau wedi'u cadw gydag allwedd sydd gennych chi yn unig. Wrth brosesu, mae'r gweinydd yn trin eich sain fel testun plaen. Dysgu am ein diogelwch.

Ydy. Mae STT.ai yn cynnig API REST gyda Python a Node.js SDKs. Mae lefel am ddim yn cynnwys 100 munud/mis.

Ydy. Mae gan STT.ai golygydd trosysgrif mewnol lle gallwch chi gywiro gwallau, ail-enwi siaradwyr, a gosod stampiau amser.

Mae pob trosglwyddiad yn cael cyswllt unigryw y gellir ei rannu. Allforio i DOCX neu PDF ar gyfer e-bost. Mae cynlluniau Pro yn cynnig cysylltiadau parhaol a diogel gan gyfrinair.

STT.ai supports 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, and more. URL transcription works only with publicly available audio and video. DRM-protected content (such as Spotify premium episodes, Netflix, Disney+, etc.) cannot be transcribed. For DRM content, download the file separately and upload it directly.