Darmowe narzędzie transcription
Wyślij plik, nagraj z mikrofonu lub wklej URL. AI transkryptuje w sekundach.
100+ Języki
Automatyczne wykrywanie lub wybór. Wszystkie główne języki obsługiwane.
Wykrywanie głośnika
Identyfikuje, kto to powiedział automatycznie.
Szyfrowanie ze strony klienta
Zaszyfruj transkrypty w swojej przeglądarce.
6 Formaty eksportu
TXT, SRT, VTT, DOCX, JSON, PDF.
Jak działa
1
Wyślij lub nagrywaj
Wyślij plik audio/wideo, wklej URL z YouTube lub dowolnej platformy lub nagraj z mikrofonu.
2
Przepisy AI
Wybierz z wielu modeli AI. Język wykryty automatycznie. Diaryzacja głośnika identyfikuje, kto co powiedział.
3
Eksportuj & Udostępnianie
Pobierz jako TXT, SRT, VTT, DOCX, JSON lub PDF. Podziel się linkiem. Poprawa z AI dla większej dokładności.
Często zadawane pytania
Wyślij pliki audio lub wideo do STT.ai, wklej na żywo URL lub nagrywaj na żywo. Wybierz swój preferowany model AI i kliknij Transcribe. Większość plików zakończona w ciągu poniżej 5 minut. Eksportuj jako TXT, SRT, VTT, DOCX, JSON lub PDF.
Tak — STT.ai daje każdemu gościowi 600 bezpłatnych minut/miesiąc, bez konieczności rejestracji dla Twojego pierwszego pliku. Wypłacane plany rozpoczynające się od $5/miesiąc odblokować dłuższe pliki, prywatne transkrypty i priorytetowe kolejki.
Dokładność zależy od jakości modelu i dźwięku. Nasze najlepsze modele osiągają 3-5% Błąd słowa w odniesieniu do poziomów odniesienia – 95-97% dokładność w zakresie czystego wypowiedzi. Narzędzie porównania pozwala uruchomić wiele modeli na tym samym pliku i wybrać najlepszy.
STT.ai oferuje 10+ modeli — STT.ai Poprawa (najbardziej dokładna), Whisper Large V3 (99 języków), NVIDIA Canary (#1 WER na obsługiwanych langach), Whisper Turbo (szybka), Moonshine (łagodna) i więcej. Każda z modeli ma szczegóły.
Tak. Eksportuj transkrypcję jako pliki napisów SRT lub VTT – pracują z YouTube, Vimeo, TikTok, VLC i każdym głównym odtwarzaczem wideo. Narzędzie wypalenia-subtitles przekłada je na wideo jako twarde subsubsy.
Tak. Dializacja głośnika automatycznie etykietuje każdy głos (Głośnik 1, Głośnik 2,...) i można je nazwać w edytorze. Pracuje na wszystkich modelach i językach.
Większość plików jest transkrybowana w mniej niż 5 minut. 1-godzinny plik audio zazwyczaj kończy się w 2-3 minuty z naszymi najszybszymi modelami. Prędkość zależy od wyboru modelu i bieżącego obciążenia.
STT.ai obsługuje formaty 20+ wejściowe — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i inne. Wyjście do TXT, SRT, VTT, DOCX, JSON i PDF.
Tak. Pliki audio są przetwarzane i usuwane domyślnie. Pro plany dodają szyfrowanie klient-side – nawet jeśli nasza baza danych jest naruszona, Twoje transkrypty są nieczytelne bez klucza. Dane nigdy nie są wykorzystywane do treningu modelu bez wyraźnego opt-in.
Tak. STT.ai oferuje REST API z Python i Node.js SDKs, plus MCP serwer dla Claude i Cursor. Darmowy API poziom obejmuje 100 minut/miesiąc.
Tak. Każdy transkrypt otwiera się w naszym wbudowanym edytorze, gdzie można poprawić słowa, zmienić nazwę głośników, dostosować czas i dodać notatki. Wszystkie zmiany zapisują automatycznie.
Każdy transkrypt otrzymuje unikalny dzielony URL. Eksport do DOCX lub PDF do e-mailu. Pro plany dodaje hasło chronione i stałe linki — przydatne dla pracy klienta.
STT.ai obsługuje platformy 1300+, w tym YouTube, Vimeo, TikTok, SoundCloud i więcej. Transkrypcja URL działa wyłącznie z publicznie dostępnymi zawartościami – źródła ochrony przed DRM nie mogą być transkrybowane.