Vapaa tekoäly Puhe tekstille

Kuvaa ääni ja video tekstiksi 100+ kielellä. 10+ tekoälymallit. Kaiuttimen tunnistusta ei tarvita.

4.1K
Transkriptiot
109.4K
minuutteja kaiverrettu
100+
kielet
70+
ilmaisia työkaluja

Toimii julkisesti saatavilla olevan äänen ja videon kanssa. DRM-suojattua sisältöä ei tueta.

Parannuksia parannuksiin
Private transcript
Juttele transkriptin kanssa
Avaa Pron kanssa →
Jätä tiedosto tähän tai napsauta selataksesi
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – enintään 2GB
Parannuksia parannuksiin
Private transcript
Juttele transkriptin kanssa
Avaa Pron kanssa →
Parannuksia parannuksiin
Tallennus: 0:00
Reaaliaikainen Vosk (instant)
Tehostettu Kuiskaaja (tarkka)
Julkiset linkit: 24h, vain teksti · Rekisteröidy 7d+-äänelle · Pro yksityisille linkeille

Reaaliaikainen puhe tekstiksi. Tekoäly korjaa automaattisesti puhuessasi – tarkkuus paranee pidemmällä puheella.

Testaa mikrofonisi ensin
❤️ Love STT.ai? Tell your friends!
Käytit ilmaisia transkriptioitasi.

Rekisteröidy ilmaiseksi 600 minuuttia kuukaudessa tai päivitä rajattomat transkriptiot.

10 ilmaista min/päivä 600 min ilmaiseksi ilmoittautumalla Ei luottokorttia Salattu
Rekisteröidy ilmaiseksi →
Client-Side Salattu Varasto — Selostuksesi on salattu selaimeesi, emmekä edes me pysty lukemaan niitä. Opi, miten se toimii →

Miten STT.ai toimii

Kolme askelta tarkassa transkriptiossa

1. Lataa, tallenna tai liitä URL

Vedä ja pudota kaikki ääni- tai videotiedostot (MP3, WAV, MP4 ja 20+ formaatit). Tallenne mikrofonista reaaliaikaisesti. Tai liitä linkki YouTubesta, Vimeosta, TikTokista ja 1300+-alustoista.

2. Tekoäly kirjoittaa mallivalintaasi

Valitse 10+ tekoälymallista, kuten Whisper, NVIDIA Canary (#1 tarkkuus) ja Moonshine. Tunnista kieli automaattisesti 100+ vaihtoehdosta. Kaiuttimen diarisaatio tunnistaa, kuka sanoi mitäkin.

3. Vie, Jaa tai Integrate

Lataa TXT-, SRT-, VTT-, DOCX-, JSON- tai PDF-muodossa. Jaa linkin kautta. Käytä API-rajapintaamme, jotta voit integroida transkriptiosi sovellukseesi. Täydellinen tekstitykseen, kokousmuistiinpanoihin, podcastiin ja muuhun.

100+
Kieliä tuetaan
70+
Vapaat työkalut
1,300+
Alustat tuettu
7
Vie muodot

Kehittäjä-Ensimmäinen API

Integroi puheento-teksti sovellukseen muutamassa minuutissa. Restful API reaaliaikaisella WebSocket-suoratoistolla.

REST + WebSocket — Tiedoston lataaminen ja reaaliaikainen suoratoisto
Useita malleja — Kuiskaaja, Canary, Enhanced & more
Kaiuttimen diarisointi — Automaattitunnistin, joka sanoi mitä
Joustava ulostulo — JSON, TXT, SRT, VTT ja aikaleimat
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Oletko valmis kirjoittamaan?

Lataa ensimmäinen tiedosto ilmaiseksi. Ei luottokorttia, ei ilmoittautumista. 600 minuuttia kuukaudessa vapaalla suunnitelmalla.

Aloita uudelleen kirjoittaminen

Usein kysyttyjä kysymyksiä

Lataa ääni- tai videotiedosto STT.ai:een. Valitse haluamasi tekoälymalli ja -vaihtoehdot ja napsauta Transcribe. Selostus valmistuu muutamassa minuutissa. Vie TXT-, SRT-, VTT-, DOCX-, JSON- tai PDF-muodossa.

Kyllä! STT.ai tarjoaa 600 ilmaista minuuttia kuukaudessa kaikille käyttäjille. Ensimmäiseen transkriptioon ei tarvitse kirjautua. Maksetut suunnitelmat, joissa on enemmän minuutteja ja ominaisuuksia, alkavat 5 dollarista kuukaudessa.

Tarkkuus riippuu valitsemastasi tekoälymallista ja äänenlaadusta. Parhailla malleillamme saavutetaan 5–7 prosentin Word Error Rate -arvo viitearvoilla, mikä tarkoittaa 93–95 prosentin tarkkuutta. Selkeä ääni, jossa taustamelu on mahdollisimman vähäistä, tuottaa parhaat tulokset.

STT.ai tarjoaa 10+-malleja, kuten Whisper Large V3, NVIDIA Canary, ja enemmän. Voit verrata tuloksia eri malleista samassa tiedostossa.

Kyllä. Vie transkriptisi strt- tai VTT-tekstitystiedostoina, jotka toimivat YouTubessa, Vimeossa ja kaikilla suurilla videoalustoilla.

Kyllä. STT.ai tunnistaa ja leimaa automaattisesti eri kaiuttimet tekoälykaiuttimen diarisoinnin avulla. Toimii kaikilla malleilla ja kielillä.

Useimmat tiedostot on kirjoitettu alle 5 minuutissa. 1 tunnin äänitiedosto kestää yleensä 2-3 minuuttia nopeimmilla malleillamme.

STT.ai tukee 20+-ääni- ja videoformaatteja, kuten MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM ja AVI. Vie TXT-, SRT-, VTT-, DOCX-, JSON- tai PDF-muodossa.

Kyllä. Äänitiedostoja käsitellään ja poistetaan transkription jälkeen. Tietojasi ei koskaan käytetä koulutukseen. Asiakaspuolen salaus on ilmainen kaikissa suunnitelmissa – se salaa tallennetut transkriptit avaimella, joka vain sinulla on. Käsittelyn aikana palvelin käsittelee ääntäsi tavallisella tekstillä. Tutustu turvallisuuteemme.

Kyllä. STT.ai tarjoaa REST-rajapintaa Pythonilla ja Node.js SDK:lla. Vapaa taso sisältää 100 minuuttia kuukaudessa.

Kyllä. STT.ai sisältää sisäänrakennetun transkriptioeditorin, jossa voit korjata virheitä, nimetä kaiuttimet uudelleen ja säätää aikaleimat.

Jokainen transkripti saa ainutlaatuisen jaettavan linkin. Vie DOCX:ään tai PDF:ään sähköpostia varten. Pron suunnitelmat tarjoavat salasanasuojattuja ja pysyviä linkkejä.

STT.ai tukee 1 300+ alustaa, kuten YouTubea, Vimeoa, TikTokia, SoundCloudia ja muuta. URL-transkriptio toimii vain julkisesti saatavilla olevalla äänen ja videon avulla. DRM-suojattua sisältöä (kuten Spotifyn premium-jaksoja, Netflixiä, Disney+:ta) ei voi siirtää. DRM-sisällön osalta lataa tiedosto erikseen ja lataa se suoraan.