Laisva AI Kalba tekstui

Atsekti garsą ir vaizdo įrašą į tekstą 100+ kalbomis. 10+ AI modeliai. Garsiakalbio aptikimas. Nereikia užsiregistruoti.

4.3K
Transkripcija
121.2K
minučių pertraukimas
100+
kalbos
70+
laisvos priemonės

Veikia su viešai prieinama garso ir vaizdo medžiaga. DRM apsaugotas turinys nepalaikomas.

Atnaujinti tobulinimui
Private transcript
Pokalbis su stenograma
Atrakinti su Pro →
[Translation temporarily unavailable. Please try again.]
[Translation temporarily unavailable. Please try again.]
Atnaujinti tobulinimui
Private transcript
Pokalbis su stenograma
Atrakinti su Pro →
Atnaujinti tobulinimui
Įrašas: 0:00
Realusis laikas Voskas (nuolat)
[Translation temporarily unavailable. Please try again.] Visper (tikslus)
Viešosios nuorodos: 24h, tik tekstas · Užsiregistruoti [Translation temporarily unavailable. Please try again.] · Pro [Translation temporarily unavailable. Please try again.]

Kalbėjimas realiu laiku su tekstu. AIS auto-korekcija, kai jūs kalbate — tikslumas pagerina ilgiau kalba.

[Translation temporarily unavailable. Please try again.]
❤️ Love STT.ai? Tell your friends!
Jūs naudojote savo nemokamus transkripciją

Užsiregistruoti nemokamai gauti 600 minučių/mėnesį, arba atnaujinti neribotą transkripciją.

10 nemokamų min. per dieną 600 min be registracijos Nėra kredito kortelės [Translation temporarily unavailable. Please try again.]
Užsiregistruoti nemokamai →
Kliento slaptasis saugojimas — Jūsų stenogramos yra šifruotos jūsų naršyklėje. Net mes negalime jų perskaityti. Sužinokite, kaip tai veikia →

Kaip veikia STT.ai

Trys žingsniai siekiant tikslaus transkripcijos

1. Įkelkite, įrašykite, arba įdėti URL

Vilkite ir numeskite bet kokį garso ar vaizdo failą (MP3, WAV, MP4 ir 20+ formatai). Įrašykite iš savo mikrofono realiu laiku. Arba įdėkite nuorodą iš "YouTube", "Vimeo", "TikTok", ir 1300+ platformų.

2. AIS perrašinėja su Jūsų pasirinktu modeliu

Pasirinkite iš 10+ AI modelių, įskaitant Whisper, NVIDIA Canary (#1 tikslumas) ir Moonshine. Auto-aptikti kalbą iš 100+ variantų. Garsiakalbio diarizacija identifikuoja, kas sakė, ką.

3. Eksportuoti, Share, arba integruoti

Atsisiųskite kaip TXT, SRT, VTT, DOCX, JSON arba PDF. Pasidalinkite per nuorodą. Naudokite mūsų API, kad integruotų transkripciją į savo app. Puikiai tinka subtitrams, posėdžio užrašams, podcast, ir daugiau.

100+
Kalbos palaikomos
70+
Laisvi įrankiai
1,300+
Palaikomos platformos
7
Eksportuoti formatus

Programuotojas- pirmasis API

Integruokite kalbą-į-tekstą į savo app minutės. RESTful API su realiu laiku WebSocket srautų.

REST + WebSocket — Failų atsiuntimas ir realaus laiko transliacija
Keli modeliai — Whisper, Kanarų, Patobulintas & daugiau
Garsiakalbių diarizacija — Automatiškai nustatyti, kas pasakė ką
Lanksti išvestis — JSON, TXT, SRT, VTT su žodžiu timestamp reikšmėmis
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Pasiruošę transliuoti?

Atsisiųsti pirmąjį failą nemokamai. Nėra kredito kortelės, nėra registracijos. 600 minučių per mėnesį ant nemokamo plano.

Pradėti transkripciją

Dažnai užduodami klausimai

Įkelkite garso ar vaizdo failą į STT.ai. Pasirinkite pageidaujamą AI modelį ir parinktis, tada spustelėkite Perrašymą. Jūsų transkriptas bus paruoštas minutėmis. Eksportuokite kaip TXT, SRT, VTT, DOCX, JSON arba PDF.

Taip! STT.ai siūlo 600 nemokamai minučių per mėnesį visiems vartotojams. Nėra registracijos reikia jūsų pirmą kartą transkripcija. Mokami planai su daugiau minučių ir funkcijos prasideda $5/mėnesį.

Tikslumas priklauso nuo AI modelio, kurį pasirinkote, ir nuo garso kokybės. Mūsų geriausi modeliai užtikrina 5-7% "Žodžių klaidų Įvertinimas" lyginamuosiuose standartuose, o tai reiškia, kad 93-95%+ tikslumas. Išvalyti garsą su minimaliu fono triukšmu duoda geriausius rezultatus.

STT.ai siūlo 10+ modelius, įskaitant Whisper didelis V3, NVIDIA Canary, ir daugiau. Galite palyginti rezultatus iš įvairių modelių tame pačiame faile.

Taip. Po transkripcijos, eksportuoti savo stenogramą kaip SRT ar VTT subtitrų failus. Tai veikia su "YouTube", "Vimeo" ir visomis pagrindinėmis vaizdo platformomis.

Taip. STT.ai automatiškai identifikuoja ir ženklina skirtingus garsiakalbius naudodami AI garsiakalbio diarizaciją. Veikia visuose modeliuose ir kalbose.

Dauguma failų perrašomi per 5 minutes. 1 valandos garso failas paprastai trunka 2-3 minutes su mūsų greičiausiais modeliais.

STT.ai palaiko 20+ garso ir vaizdo formatus, įskaitant MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, ir AVI. Eksportuoti kaip TXT, SRT, VTT, DOCX, JSON, arba PDF.

Taip. Garso failai apdorojami ir ištrinami po transkripcijos. Jūsų duomenys niekada nenaudojami mokymui. Kliento pusės šifravimas nemokamas visuose planuose — jis šifruoja saugomus transkripciją tik su raktu, kurį turite. Apdorojus serveris tvarko jūsų garsą paprastame tekste. Sužinokite apie mūsų saugumą.

Taip. STT.ai siūlo REST API su Python ir Node.js SDK. Nemokama Pakopa apima 100 minučių/mėnesį.

Taip. STT.ai apima įmontuotą stenogramos redaktorių, kur galite ištaisyti klaidas, pervadinti garsiakalbius, ir koreguoti žymeles.

Kiekvienas transkriptas gauna unikalią bendrą nuorodą. Eksportuoti į DOCX arba PDF elektroniniu paštu. Pro planai siūlo slaptažodžiu apsaugotas ir nuolatines nuorodas.

STT.ai palaiko 1,300+ platformas, įskaitant YouTube, Vimeo, TikTok, SoundCloud ir kt. URL transkripcija veikia tik su viešai prieinama garso ir vaizdo medžiaga. DRM apsaugotas turinys (pvz., Spotify premium epizodai, Netflix, Disney+ ir t.t.) negali būti transkripcija. DRM turiniui atsisiųsti ir įkelti tiesiogiai.