Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Często zadawane pytania
Wyślij pliki audio lub wideo do STT.ai. Wybierz swój preferowany model i opcje AI, a następnie kliknij Transcribe. Twój transkrypt będzie gotowy w ciągu minut. Eksportuj jako TXT, SRT, VTT, DOCX, JSON lub PDF.
Tak! STT.ai oferuje 600 bezpłatnych minut miesięcznie dla wszystkich użytkowników. Nie wymaga się rejestracji dla pierwszej transkrypcji. Płacone plany z więcej minut i funkcje zaczynają się od 5 dolarów miesięcznych.
Dokładność zależy od wybranego przez Ciebie modelu AI i jakości dźwięku. Nasze najlepsze modele osiągają 5-7% Błąd słowa w odniesieniu do poziomów odniesienia, co oznacza 93-95%+ dokładność. Wyraźny dźwięk o minimalnym hałasie tła daje najlepsze wyniki.
STT.ai oferuje modele 10+, w tym Whisper Large V3, NVIDIA Canary, i więcej. Porównaj wyniki różnych modeli w tym samym pliku.
Tak. Po transkrypcji eksportuj transkrypcję jako pliki napisów SRT lub VTT. Pracują one z YouTube, Vimeo i wszystkimi głównymi platformami wideo.
Tak. STT.ai automatycznie identyfikuje i etykietuje różne głośniki przy użyciu diaryzacji głośnika AI. Pracuje we wszystkich modelach i językach.
Większość plików jest transkrybowana w mniej niż 5 minut. 1-godzinny plik audio zazwyczaj zajmuje 2-3 minuty z naszymi najszybszymi modelami.
STT.ai obsługuje 20+ formaty audio i wideo, w tym MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM i AVI. Eksport jako TXT, SRT, VTT, DOCX, JSON lub PDF.
Tak. Pliki audio są przetwarzane i usuwane po transkrypcji. Twoje dane nigdy nie są używane do treningu. Szyfrowanie klienta jest bezpłatne we wszystkich planach – szyfruje zapisy zapisy tylko kluczem. Podczas przetwarzania serwer obsługuje dźwięk w raporcie. Dowiedz się o naszej bezpieczeństwie.
Tak. STT.ai oferuje REST API z Python i Node.js SDKs. Darmowy poziom obejmuje 100 minut/miesiąc.
Tak. STT.ai zawiera wbudowany edytor transkrypcji, w którym można poprawić błędy, nazwę głośników i dostosować czas.
Każdy transkrypt ma unikalny łączy dzielony. Eksport do DOCX lub PDF do e-mailu. Pro plany oferują chronione hasłem i stałe linki.
STT.ai obsługuje 1.300+ platformy, w tym YouTube, Vimeo, TikTok, SoundCloud i więcej. Transkrypcja URL działa tylko z publicznie dostępnym audio i wideo. Zawartość DRM chroniona (taka jak epizody premium Spotify, Netflix, Disney+ itp.) nie może być transkrybowana. Dla treści DRM, pobierz plik oddzielnie i wyślij go bezpośrednio.