Transcribe with Moonshine
7.8%
WER
1
Languages
80.0x
Speed
MIT
License
About Moonshine
Languages Supported by Moonshine
Model Info
- ProviderUseful Sensors
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Często zadawane pytania
Moonshine jest modelem mowy do tekstu przez Useful Sensors. STT.ai hosts Moonshine na naszej infrastrukturze GPU, dzięki czemu można go wykorzystać bez dostarczania własnego sprzętu – wyślij audio lub wideo i wybierz Moonshine z wybieracza modeli.
W odniesieniu do standardowych poziomów odniesienia Moonshine osiąga około 7.8% Błędów Word. Dokładność rzeczywistego świata zależy od jakości dźwięku, akcentu i języka; w przypadku głośnych lub akcentowanych nagrań, oczekuje się kilku punktów procentowych wyższych WER.
Moonshine biegnie na wolnym poziomie STT.ai – każdy odwiedzający otrzymuje 600 minut/miesiąc bez kosztu. Płacone plany dodają dłużej limity na pliki, prywatne transkrypty i priorytetowe kolejki.
Moonshine jest wydane pod MIT, licencja otwartego źródła. Można samodzielnie gospodarować Moonshine na własnym sprzętie lub korzystać z naszej hospodowanej wersji – obie są komercyjne użyteczne.
Moonshine obsługuje 1 języków. Automatyczne wykrywanie wybiera właściwy język dla większości audio; można również wskazywać go ręcznie dla małego podnoszenia dokładności.
Moonshine procesów audio w około 80.0x w czasie rzeczywistym na naszych GPU. 1-godzinny plik audio zakończy się w mniej niż 8802 minut; dłuższa kolejka plików i powiadomić za pośrednictwem e-maila.
Moonshine ma 8802 parametrów. Większe modele są zazwyczaj bardziej dokładne, ale wolniej; STT.ai hostów Moonshine w GPU, tak aby liczba parametrów nie wpływała na wydajność klienta.
Moonshine akceptuje każdy format obsługi STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i inne. Wynik jako TXT, SRT, VTT, DOCX, JSON lub PDF.
Tak. Dializacja głośnika biegnie obok Moonshine dla każdej transkrypcji — każdy głośnik jest oznaczony i można je później zmienić w edytorze.
Tak. Moonshine uruchamia w naszym zarządzanym środowisku – audio jest przetwarzany i usuwany domyślnie i nigdy nie używany do szkolenia bez wyraźnego opt-in. Pro plany dodają klient-side szyfrowanie do transkrypcji w pokoju.
Użyj narzędzia porównania-stt, aby uruchomić Moonshine w stosunku do jakiegokolwiek innego modelu obsługiwanego w tym samym audio – zobaczysz WER, liczbę segmentów, etykiety głośnika i wyniki ufności po stronie. Porównanie Moonshine ws Whisper Large V3 jest najczęściej uruchomione.
Tak. Określić "moonshine" jako parametr modelu w końcowym punktie końcowym /v1/transcribe. Python i Node.js SDKs zawierają Moonshine przykładów. Darmowy poziom API obejmuje 100 minut/miesiąc.
Tak. Ponieważ Moonshine jest 8802-licenzowany, możesz go sam-host. STT.ai stron otwartego źródła wykazuje repo i wagi projektu. Większość zespołów produkcyjnych korzysta z naszej hosted wersji, aby pominąć zamówienia GPU, modele swaps i ops.