Ka Papa Hana

Ka Hōʻike a me ka Hoʻopā

Hoʻomaopopo a hoʻopaʻa inoa i nā mea haʻi ʻōlelo like ʻole i kāu hoʻololi leo a me nā wikiō. E ʻike pono i ka mea i ʻōlelo ai.

Hoʻohana me nā leo a me nā wikiō i loaʻa i ka lehulehu. ʻAʻole kākoʻo ʻia nā mea i pale ʻia e DRM.

Hoʻonui no ka hoʻonui

Ka hoʻoili pilikino

Kāhea me ka transcript

Hoʻokuʻu me Pro →

E hoʻokuʻu i ka faila i kēia wahi a i ʻole kaomi e kaomi

ʻO nā mea hoʻohana e hoʻohana i nā ʻano leo like ʻole e like me MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — a hiki i 2GB

Hoʻouka i nā faila he nui me Pro

Hoʻonui no ka hoʻonui

Ka hoʻoili pilikino

Kāhea me ka transcript

Hoʻokuʻu me Pro →

Hoʻonui no ka hoʻonui

Ka hoʻolaha ʻana i ka manawa maoli i ka huaʻōlelo. AI hoʻoponopono ʻia e like me kou kamaʻilio ʻana - hoʻomaikaʻi ka pololei me ka hoʻolaha lōʻihi.

Hoʻāʻo i kou leo i mua

10 min / lā manuahi 600 min manuahi me ka hoʻopaʻa inoa Kāleka kāleka Hoʻopunipuni

E hoʻopaʻa inoa no ka manuahi →

He aha ka Speaker Diarization?

ʻO ka diarization speaker ka hana o ka hoʻokaʻawale ʻana i kahi kahawai leo i nā ʻāpana e like me ka ʻike o ka mea haʻi. I nā huaʻōlelo maʻalahi, e pane ana ia i ka nīnau "hea i kamaʻilio ai?" This is essential for multi-speaker recordings like meetings, interviews, podcasts, conference calls, and legal proceedings where knowing who said what is just as important as what was said.

STT.ai uses advanced neural speaker diarization models that can detect and label speakers in real time. The system creates speaker embeddings -- numerical representations of each voice's unique characteristics -- and clusters them to distinguish between different people. This works even when speakers have similar voices or frequently interrupt each other.

Pehea e hana ai ka hoʻomaopopo ʻana i ka mea kākau

1. Hoʻomaopopo i ka hana leo

Hoʻomaopopo mua ka hoʻonohonoho i nā ʻāpana o ka leo e loaʻa ai ka ʻōlelo ma mua o ka ʻole, ke mele, a i ʻole ka leo o ka papa.

2. Ka hoʻokomo ʻana i ka mea kani

Hoʻololi ʻia kēlā me kēia ʻāpana kamaʻilio i kahi hoʻokomo leo -- he vector compact e kiʻi i nā hiʻohiʻona leo ʻokoʻa o ka mea kamaʻilio.

3. Clustering & Labeling

Embeddings i clustered i nā ʻāpana hui mai ka mea haʻi ʻōlelo like pū, a laila, i kēlā me kēia cluster i hoʻouna ʻia i kahi ʻōlelo (Speaker 1, Speaker 2, etc.).

Ka hoʻohanaʻana i nā hihia no ka hōʻike leo

Ka hoʻololi i ka hui

Hoʻouna i nā mea hoʻohana i nā hōʻike hōʻike i ka manawa like. Hoʻoili i nā minuke me ka hōʻike ʻana i ka mea i ʻōlelo ai.

Podcast transcription

Hoʻokaʻawale i waena o nā mea hoʻokipa a me nā mea kipa i nā ʻāpana podcast. Hoʻokumu i nā kāleka hōʻike me ka hoʻouna leo kūpono.

Ka hoʻololi ʻana i ka nīnauele

Hoʻokaʻawale i nā pane o ka mea noiʻi a me ka mea noiʻi no ka noiʻi, ka hoʻopunipuni, a me ka hoʻokō ʻana i nā palapala.

Ka Manaʻo a me ka Hoʻokō

E hana i nā moʻolelo o nā hōʻike, nā hoʻokolokolo, a me nā kelepona hoʻokō me ka hōʻike.

Ka Hōʻike Hoʻolaha ma STT.ai

Speaker detection is available on all paid plans. When you transcribe audio or video with speaker detection enabled, the transcript will include speaker labels inline with the text. You can also export speaker-labeled transcripts in all supported formats including SRT, VTT, DOCX, JSON, and PDF.

Speaker 1 [00:00:01]: Welcome to the meeting, everyone. Let's start with the quarterly review. Speaker 2 [00:00:05]: Thanks. I have the numbers ready. Revenue is up 23% quarter over quarter. Speaker 1 [00:00:12]: That's great news. Can you walk us through the breakdown?

The system can detect up to 20 distinct speakers in a single recording. For best results, ensure each speaker has at least a few seconds of solo speech. Overlapping speech is handled but may reduce accuracy in heavily cross-talked segments.

E hoʻāʻo i ka hōʻike leo

Hoʻouka i kahi hoʻopaʻa leo nui a e ʻike i nā leo i kapa ʻia maʻalahi.

Ke hoʻomaka nei i ka hoʻololi ʻana i ka manuahi

Nā nīnau i nīnau pinepine ʻia

Ka hōʻike ʻana o ka mea kamaʻilio e holo ana i kāu kamepiula: e hoʻopili i kahi URL, e hoʻouna i kahi faila, a i ʻole e hoʻopaʻa i kāu mic. STT.ai e koho i ka AI model a e hoʻihoʻi i ka transcript i lalo o 5 mau minuke. E hoʻouna i ka TXT, SRT, VTT, DOCX, JSON, a i ʻole PDF.

ʻAʻole - loaʻa i kēlā me kēia malihini kipa nā minuke 600 manuahi e hoʻomaka i STT.ai, e hoʻohana ana no Ka hōʻike ʻana o ka mea kamaʻilio e like me kekahi o nā hana hana. Nā papa hana i uku ʻia e hoʻomaka ana ma $ 5 / mahina e hoʻouka i nā faila lōʻihi, nā transcripts pilikino a me ka hoʻouna ʻana i nā koho.

Hoʻokō ka Ka hōʻike ʻana o ka mea kamaʻilio i nā ʻano AI like me ka ʻaoʻao STT.ai - ʻo kā mākou mau ʻano maikaʻi loa e hiki ai i ka ʻike 95-97% ma ka ʻōlelo maʻemaʻe (3-5% ʻO ka ʻōlelo ʻole o ka ʻōlelo ma nā mea hoʻohālikelike).

Ka hōʻike ʻana o ka mea kamaʻilio hiki ke hoʻokō i kekahi o nā ʻano STT.ai 10+ - STT.ai Enhanced (ka mea pololei loa), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER ma nā langs i kākoʻo ʻia), Whisper Turbo (fast), Moonshine (lightweight), a me nā mea hou aʻe.

ʻAe. Hoʻouna ʻia nā huaʻōlelo āpau i SRT a i ʻole VTT - hana me YouTube, Vimeo, TikTok, VLC, a me nā mea pāʻani wikiō nui. Hoʻouka ka mea hana i nā huaʻōlelo i nā wikiō e like me nā hardsubs.

ʻAe. Hoʻouna ka mea kamaʻilio i nā hua'ōlelo i kēlā me kēia leo (Ka mea kamaʻilio 1, Ka mea kamaʻilio 2,...) a hiki iā ʻoe ke hoʻololi i kā lākou inoa i ka mea kākau i hoʻokomo ʻia. Hoʻohana ia ma nā ʻano a me nā ʻōlelo āpau.

ʻO ka hapa nui o nā hana Ka hōʻike ʻana o ka mea kamaʻilio e pau ana i lalo o 5 mau minuke. ʻO kahi faila leo 1-hour e hoʻopau i nā minuke 2-3 me kā mākou mau ʻano wikiwiki. E pili ana ka wikiwiki i ka ʻano i koho ʻia a me ka GPU o kēia manawa.

Ka hōʻike ʻana o ka mea kamaʻilio accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

ʻAe. Hoʻouna ʻia nā faila leo i Ka hōʻike ʻana o ka mea kamaʻilio a hoʻouna ʻia a hoʻopau ʻia e ka hoʻonohonoho hoʻonohonoho. Hoʻohui nā papa hana Pro i ka encryption client-side — inā paha i hoʻopunipuni ʻia ka waihona o STT.ai, ʻaʻole hiki ke heluhelu ʻia kāu mau transcripts me kāu kī. ʻAʻole hoʻohana ʻia ka ʻike no ka hoʻomaʻamaʻa ʻana i nā ʻano me ka ʻole o ka hoʻopili ʻana.

ʻAe. Hāʻawi ka STT.ai i kahi API REST me nā SDK Python a me Node.js, a me kahi server MCP no Claude a me Cursor - hiki ke hoʻohana i nā mea āpau no Ka hōʻike ʻana o ka mea kamaʻilio nā kaʻina hana.

ʻAe. Hoʻouka ʻia nā transcript āpau i ka mea kākau i hoʻokomo ʻia kahi e hiki ai iā ʻoe ke hoʻoponopono i nā huaʻōlelo, hoʻololi i nā inoa o nā mea kamaʻilio, hoʻoponopono i nā manawa, a hoʻohui i nā nūhou. Hoʻouna ʻia nā hoʻololi āpau i ka manawa like.

Hoʻouna i ka DOCX a i ʻole PDF no ka leka uila. Hoʻohui nā papa hana Pro i nā loulou i pale ʻia e ka ʻōlelo huna a me nā loulou kūwaho - he mea nui no ka hana o ka mea kūʻai aku.

Hoʻokō ʻo STT.ai i nā papa 1,300 + e like me YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, nā mea hoʻokipa podcast, a pēlā aku. Hoʻohana ka hoʻololi URL i nā mea i loaʻa i ka lehulehu wale nō - ʻaʻole hiki ke hoʻololi i nā mea i pale ʻia e DRM.

Ka Hōʻike a me ka Hoʻopā

He aha ka Speaker Diarization?

Pehea e hana ai ka hoʻomaopopo ʻana i ka mea kākau

1. Hoʻomaopopo i ka hana leo

2. Ka hoʻokomo ʻana i ka mea kani

3. Clustering & Labeling

Ka hoʻohanaʻana i nā hihia no ka hōʻike leo

Ka Hōʻike Hoʻolaha ma STT.ai

E hoʻāʻo i ka hōʻike leo

Nā nīnau i nīnau pinepine ʻia

Pehea e hana ai ka Ka hōʻike ʻana o ka mea kamaʻilio ma STT.ai?

He manuahi anei Ka hōʻike ʻana o ka mea kamaʻilio?

He aha ka pololei o Ka hōʻike ʻana o ka mea kamaʻilio?

He aha nāʻano AI e hiki ai iaʻu ke hoʻohana no Ka hōʻike ʻana o ka mea kamaʻilio?

Hiki iaʻu ke kiʻi i nā hua'ōlelo mai Ka hōʻike ʻana o ka mea kamaʻilio?

Does Ka hōʻike ʻana o ka mea kamaʻilio detect different speakers?

He aha ka lōʻihi o Ka hōʻike ʻana o ka mea kamaʻilio?

He aha nāʻano hoʻokomo i kākoʻoʻia e Ka hōʻike ʻana o ka mea kamaʻilio?

He pilikino koʻu leo inā kaʻu e hoʻohana ana i Ka hōʻike ʻana o ka mea kamaʻilio?

He API Ka hōʻike ʻana o ka mea kamaʻilio paha?

Hiki iaʻu ke hoʻoponopono i ka transcript Ka hōʻike ʻana o ka mea kamaʻilio ma hope?

Pehea au e hoʻokaʻawale ai i ka mea i hanaʻia e Ka hōʻike ʻana o ka mea kamaʻilio?

He aha nā papa hana'ē aʻe e hana ana ma waho o Ka hōʻike ʻana o ka mea kamaʻilio?