Zgłosić błąd / żądanie funkcji

Transcribe z Moonshine

Name: Moonshine
Author: Useful Sensors

Pracuje z publicznie dostępnym audio & wideo. Zawartość zabezpieczona DRM nie jest obsługiwana.

Aktualizacja dla poprawy

Prywatny transkrypt

Rozmowa z transkrypcją

Odblokuj za pomocą Pro →

Przepuść plik tutaj lub kliknij aby przeglądać

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — do 2GB

Pakietowe wysyłanie plików wielokrotnych z Pro

Aktualizacja dla poprawy

Prywatny transkrypt

Rozmowa z transkrypcją

Odblokuj za pomocą Pro →

Aktualizacja dla poprawy

Przemówienie w czasie rzeczywistym do tekstu. AI automatycznie poprawia się w momencie, gdy mówisz – dokładność poprawia się przy dłuższej mowie.

Najpierw sprawdź mikrofon

10 bezpłatnych min/dzień 600 minut bezpłatnie z rejestracją Brak karty kredytowej Zaszyfrowane

Zarejestruj się za darmo →

7.8%

WER

Języki

80.0x

Prędkość

MIT

Licencja

O tematie Moonshine

Moonshine jest niezwykle kompaktowym modelem mowy do tekstu zaprojektowanym dla środowiska wykorzystującego zasoby. Przy tylko 61M parametrów, działa efektywnie na krawędzi urządzeń, takich jak Raspberry Pi przy jednoczesnym zachowaniu rozsądnej poprawności transkrypcji angielskiej.

Języki wspierane przez Moonshine

Angielski

Informacje o wzorze

DostawcaUseful Sensors
Architektura-
LicencjaMIT
UaktualnioneMar 2026

Powiązane modele

3.2% WER

4.2% WER

5.1% WER

3.5% WER

3.0% WER

Często zadawane pytania

Moonshine jest modelem mowy do tekstu przez Useful Sensors. STT.ai hosts Moonshine na naszej infrastrukturze GPU, dzięki czemu można go wykorzystać bez dostarczania własnego sprzętu – wyślij audio lub wideo i wybierz Moonshine z wybieracza modeli.

W odniesieniu do standardowych poziomów odniesienia Moonshine osiąga około 7.8% Błędów Word. Dokładność rzeczywistego świata zależy od jakości dźwięku, akcentu i języka; w przypadku głośnych lub akcentowanych nagrań, oczekuje się kilku punktów procentowych wyższych WER.

Moonshine biegnie na STT.ai bezpłatny poziom – każdy gościa otrzymuje 600 minut na rozpoczęcie bez kosztów. Wypłata planów dodaje dłużej limity na pliki, prywatne transkrypty i priorytetowe kolejki.

Moonshine jest wydane pod MIT, licencja otwartego źródła. Można samodzielnie gospodarować Moonshine na własnym sprzętie lub korzystać z naszej hospodowanej wersji – obie są komercyjne użyteczne.

Moonshine obsługuje 1 języków. Automatyczne wykrywanie wybiera właściwy język dla większości audio; można również wskazywać go ręcznie dla małego podnoszenia dokładności.

Moonshine procesów audio w około 80.0x w czasie rzeczywistym na naszych GPU. 1-godzinny plik audio zakończy się w mniej niż 8802 minut; dłuższa kolejka plików i powiadomić za pośrednictwem e-maila.

Moonshine ma 8802 parametrów. Większe modele są zazwyczaj bardziej dokładne, ale wolniej; STT.ai hostów Moonshine w GPU, tak aby liczba parametrów nie wpływała na wydajność klienta.

Moonshine akceptuje każdy format obsługi STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i inne. Wynik jako TXT, SRT, VTT, DOCX, JSON lub PDF.

Tak. Dializacja głośnika biegnie obok Moonshine dla każdej transkrypcji — każdy głośnik jest oznaczony i można je później zmienić w edytorze.

Tak. Moonshine uruchamia w naszym zarządzanym środowisku – audio jest przetwarzany i usuwany domyślnie i nigdy nie używany do szkolenia bez wyraźnego opt-in. Pro plany dodają klient-side szyfrowanie do transkrypcji w pokoju.

Użyj narzędzia porównania-stt, aby uruchomić Moonshine w stosunku do jakiegokolwiek innego modelu obsługiwanego w tym samym audio – zobaczysz WER, liczbę segmentów, etykiety głośnika i wyniki ufności po stronie. Porównanie Moonshine ws Whisper Large V3 jest najczęściej uruchomione.

Tak. Określić "moonshine" jako parametr modelu w końcowym punktie końcowym /v1/transcribe. Python i Node.js SDKs zawierają Moonshine przykładów. Darmowy poziom API obejmuje 100 minut/miesiąc.

Tak. Ponieważ Moonshine jest 8802-licenzowany, możesz go sam-host. STT.ai stron otwartego źródła wykazuje repo i wagi projektu. Większość zespołów produkcyjnych korzysta z naszej hosted wersji, aby pominąć zamówienia GPU, modele swaps i ops.

Transcribe z Moonshine

O tematie Moonshine

Języki wspierane przez Moonshine

Informacje o wzorze

Powiązane modele

Często zadawane pytania

Ile to jest Moonshine?

Jak dokładne jest Moonshine?

Czy Moonshine jest do użytku?

Jaką licencję stosuje Moonshine?

Ile języków wspiera Moonshine?

Jak szybko jest Moonshine?

Jak duży jest model Moonshine?

Jakie formaty audio mogą wpisać Moonshine transcribe?

Czy Moonshine wykrywa wiele głośników?

Czy moje dane są prywatne podczas stosowania Moonshine?

W jaki sposób Moonshine porównuje się z innymi modelami STT?

Czy mogę użyć Moonshine za pośrednictwem API?

Mogę uruchomić Moonshine na własnym serwerze?