Wyślij pliki audio lub wideo do STT.ai, wklej na żywo URL lub nagrywaj na żywo. Wybierz swój preferowany model AI i kliknij Transcribe. Większość plików zakończona w ciągu poniżej 5 minut. Eksportuj jako TXT, SRT, VTT, DOCX, JSON lub PDF.

Tak — STT.ai daje każdemu gościowi 600 bezpłatnych minut/miesiąc, bez konieczności rejestracji dla Twojego pierwszego pliku. Wypłacane plany rozpoczynające się od $5/miesiąc odblokować dłuższe pliki, prywatne transkrypty i priorytetowe kolejki.

Dokładność zależy od jakości modelu i dźwięku. Nasze najlepsze modele osiągają 3-5% Błąd słowa w odniesieniu do poziomów odniesienia – 95-97% dokładność w zakresie czystego wypowiedzi. Narzędzie porównania pozwala uruchomić wiele modeli na tym samym pliku i wybrać najlepszy.

STT.ai oferuje 10+ modeli — STT.ai Poprawa (najbardziej dokładna), Whisper Large V3 (99 języków), NVIDIA Canary (#1 WER na obsługiwanych langach), Whisper Turbo (szybka), Moonshine (łagodna) i więcej. Każda z modeli ma szczegóły.

Tak. Eksportuj transkrypcję jako pliki napisów SRT lub VTT – pracują z YouTube, Vimeo, TikTok, VLC i każdym głównym odtwarzaczem wideo. Narzędzie wypalenia-subtitles przekłada je na wideo jako twarde subsubsy.

Tak. Dializacja głośnika automatycznie etykietuje każdy głos (Głośnik 1, Głośnik 2,...) i można je nazwać w edytorze. Pracuje na wszystkich modelach i językach.

Większość plików jest transkrybowana w mniej niż 5 minut. 1-godzinny plik audio zazwyczaj kończy się w 2-3 minuty z naszymi najszybszymi modelami. Prędkość zależy od wyboru modelu i bieżącego obciążenia.

STT.ai obsługuje formaty 20+ wejściowe — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i inne. Wyjście do TXT, SRT, VTT, DOCX, JSON i PDF.

Tak. Pliki audio są przetwarzane i usuwane domyślnie. Pro plany dodają szyfrowanie klient-side – nawet jeśli nasza baza danych jest naruszona, Twoje transkrypty są nieczytelne bez klucza. Dane nigdy nie są wykorzystywane do treningu modelu bez wyraźnego opt-in.

Tak. STT.ai oferuje REST API z Python i Node.js SDKs, plus MCP serwer dla Claude i Cursor. Darmowy API poziom obejmuje 100 minut/miesiąc.

Tak. Każdy transkrypt otwiera się w naszym wbudowanym edytorze, gdzie można poprawić słowa, zmienić nazwę głośników, dostosować czas i dodać notatki. Wszystkie zmiany zapisują automatycznie.

Każdy transkrypt otrzymuje unikalny dzielony URL. Eksport do DOCX lub PDF do e-mailu. Pro plany dodaje hasło chronione i stałe linki — przydatne dla pracy klienta.

STT.ai obsługuje platformy 1300+, w tym YouTube, Vimeo, TikTok, SoundCloud i więcej. Transkrypcja URL działa wyłącznie z publicznie dostępnymi zawartościami – źródła ochrony przed DRM nie mogą być transkrybowane.

Darmowe narzędzie transcription

Obsługiwane formaty audio i wideo

Jak działa

Wyślij lub nagrywaj

Przepisy AI

Eksportuj & Udostępnianie

Często zadawane pytania

Jak mogę nagrać dźwięk z STT.ai?

Czy STT.ai jest za darmo?

Jak dokładna jest transkrypcja STT.ai?

Jakie modele AI mogę użyć?

Mogę dostać napisy i podpisy?

Czy STT.ai wykrywa różne głośniki?

Ile czasu zajmuje transkrypcja?

Jakie formaty plików są obsługiwane?

Czy moje dane audio są prywatne?

Mogę dostać się do transkrypcji za pośrednictwem API?

Mogę zmienić transkrypcję po?

Jak mogę podzielić się swoim transkryptem?

Jakie URL i platformy są obsługiwane?