Wolny AI Przemówienie do tekstu

Transcribe audio & video to text in 100+ languages. 10+ AI modele. Wykrywanie głośnika. Nie wymaga się rejestracji.

4.1K
transkrypcje
109.4K
minut przepisanych
100+
języki
70+
wolne narzędzia

Pracuje z publicznie dostępnym audio & wideo. Zawartość zabezpieczona DRM nie jest obsługiwana.

Aktualizacja dla poprawy
Private transcript
Rozmowa z transkrypcją
Odblokuj za pomocą Pro →
Przepuść plik tutaj lub kliknij aby przeglądać
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — do 2GB
Aktualizacja dla poprawy
Private transcript
Rozmowa z transkrypcją
Odblokuj za pomocą Pro →
Aktualizacja dla poprawy
Nagrywanie: 0:00
Realizacja czasu Vosk (instant)
Poprawa Szeptanie (dokładnie)
Odnośniki publiczne: 24h, tylko tekst · Zarejestruj się. dla 7d + audio · Prof. dla odnośników prywatnych

Przemówienie w czasie rzeczywistym do tekstu. AI automatycznie poprawia się w momencie, gdy mówisz – dokładność poprawia się przy dłuższej mowie.

Najpierw sprawdź mikrofon
❤️ Love STT.ai? Tell your friends!
Użyłeś wolnych transkrypcji.

Zarejestruj się za darmo, aby otrzymać 600 minut/miesiąc, lub uaktualnić dla nieograniczonych transkrypcji.

10 bezpłatnych min/dzień 600 minut bezpłatnie z rejestracją Brak karty kredytowej Zaszyfrowane
Zarejestruj się za darmo →
Przechowywanie zaszyfrowane na stronie klienta — Twoje transkrypty są zaszyfrowane w twojej przeglądarce. Naucz się, jak działa. →

Zaufane przez profesjonalistów na całym świecie

Jak działa STT.ai

Trzy kroki do dokładnej transkrypcji

1. Wysyłka, zapis lub wklej URL

Przeciągnij i upuść dowolne pliki audio lub wideo (MP3, WAV, MP4 i 20+). Zapisuj z mikrofonu w czasie rzeczywistym. Albo wklej link z YouTube, Vimeo, TikTok i 1.300+ platform.

2. AI Przepisy z Twoim wyborem modelu

Wybierz z modeli 10+ AI, w tym Whisper, NVIDIA Canary (#1 dokładność) i Moonshine. Automatycznie wykryć język z 100+ opcji. Diarizacja głośnika identyfikuje, kto co powiedział.

3. Eksport, udział lub integracja

Pobierz jako TXT, SRT, VTT, DOCX, JSON lub PDF. Podziel się przez link. Użyj naszego API do integracji transkrypcji do aplikacji. Idealnie dla napisów, notatek spotkań, podcastów i innych.

100+
Języki obsługiwane
70+
Darmowe narzędzia
1,300+
Obsługiwane platformy
7
Eksportuj formaty

Developer- Pierwszy API

Iнтегрuj przemówienie do tekstu do aplikacji w ciągu kilku minut. RESTful API z streamingiem WebSocket w czasie rzeczywistym.

REST + WebSocket — Przesyłanie plików i strumieniowanie plików w czasie rzeczywistym
Wielokrotne modele — Szeptacz, Kanaryjski, Poprawa i więcej
Dializacja głośnika — Samodzielnie wykryć, kto co powiedział.
Wyjście elastyczne — JSON, TXT, SRT, VTT z czasami słów
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Gotowy do transkrypcji?

Wyślij swój pierwszy plik za darmo. Bez karty kredytowej, bez rejestracji. 600 minut miesięcznie na darmowy plan.

Rozpocznij transkripcję

Często zadawane pytania

Wyślij pliki audio lub wideo do STT.ai. Wybierz swój preferowany model i opcje AI, a następnie kliknij Transcribe. Twój transkrypt będzie gotowy w ciągu minut. Eksportuj jako TXT, SRT, VTT, DOCX, JSON lub PDF.

Tak! STT.ai oferuje 600 bezpłatnych minut miesięcznie dla wszystkich użytkowników. Nie wymaga się rejestracji dla pierwszej transkrypcji. Płacone plany z więcej minut i funkcje zaczynają się od 5 dolarów miesięcznych.

Dokładność zależy od wybranego przez Ciebie modelu AI i jakości dźwięku. Nasze najlepsze modele osiągają 5-7% Błąd słowa w odniesieniu do poziomów odniesienia, co oznacza 93-95%+ dokładność. Wyraźny dźwięk o minimalnym hałasie tła daje najlepsze wyniki.

STT.ai oferuje modele 10+, w tym Whisper Large V3, NVIDIA Canary, i więcej. Porównaj wyniki różnych modeli w tym samym pliku.

Tak. Po transkrypcji eksportuj transkrypcję jako pliki napisów SRT lub VTT. Pracują one z YouTube, Vimeo i wszystkimi głównymi platformami wideo.

Tak. STT.ai automatycznie identyfikuje i etykietuje różne głośniki przy użyciu diaryzacji głośnika AI. Pracuje we wszystkich modelach i językach.

Większość plików jest transkrybowana w mniej niż 5 minut. 1-godzinny plik audio zazwyczaj zajmuje 2-3 minuty z naszymi najszybszymi modelami.

STT.ai obsługuje 20+ formaty audio i wideo, w tym MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM i AVI. Eksport jako TXT, SRT, VTT, DOCX, JSON lub PDF.

Tak. Pliki audio są przetwarzane i usuwane po transkrypcji. Twoje dane nigdy nie są używane do treningu. Szyfrowanie klienta jest bezpłatne we wszystkich planach – szyfruje zapisy zapisy tylko kluczem. Podczas przetwarzania serwer obsługuje dźwięk w raporcie. Dowiedz się o naszej bezpieczeństwie.

Tak. STT.ai oferuje REST API z Python i Node.js SDKs. Darmowy poziom obejmuje 100 minut/miesiąc.

Tak. STT.ai zawiera wbudowany edytor transkrypcji, w którym można poprawić błędy, nazwę głośników i dostosować czas.

Każdy transkrypt ma unikalny łączy dzielony. Eksport do DOCX lub PDF do e-mailu. Pro plany oferują chronione hasłem i stałe linki.

STT.ai obsługuje 1.300+ platformy, w tym YouTube, Vimeo, TikTok, SoundCloud i więcej. Transkrypcja URL działa tylko z publicznie dostępnym audio i wideo. Zawartość DRM chroniona (taka jak epizody premium Spotify, Netflix, Disney+ itp.) nie może być transkrybowana. Dla treści DRM, pobierz plik oddzielnie i wyślij go bezpośrednio.