Transcrire avec Moonshine
7.8%
WER
1
Languages
80.0x
Speed
MIT
License
À propos de Moonshine
Moonshine is an extremely compact speech-to-text model designed for resource-constrained environments. At only 61M parameters, it runs efficiently on edge devices like Raspberry Pi while maintaining reasonable English transcription accuracy.
Langues prises en charge par Moonshine
Model Info
- ProviderUseful Sensors
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Questions fréquemment posées
Moonshine est un modèle speech-to-text par Useful Sensors. STT.ai héberge Moonshine sur notre infrastructure GPU afin que vous puissiez l'utiliser sans fournir votre propre matériel — télécharger audio ou vidéo et choisir Moonshine à partir du modèle de sélection.
Sur les repères standard, Moonshine atteint environ 7.8% de Word Error Rate. La précision du monde réel dépend de la qualité audio, de l'accent et de la langue; pour les enregistrements bruyants ou accentués, attendez quelques points de pourcentage plus haut WER.
Moonshine fonctionne sur le niveau gratuit de STT.ai — chaque visiteur obtient 600 minutes/mois sans frais. Les plans payants ajoutent plus de limites par fichier, des transcriptions privées et la file d'attente prioritaire.
Moonshine est publié sous MIT, une licence open-source permissive. Vous pouvez vous-même héberger Moonshine sur votre propre matériel ou utiliser notre version hébergée — les deux sont utilisables commercialement.
Moonshine prend en charge 1 langues. La détection automatique choisit la bonne langue pour la plupart des audio; vous pouvez également le spécifier manuellement pour un petit ascenseur de précision.
Moonshine traite l'audio à environ 80.0x en temps réel sur nos GPUs. Un fichier audio d'une heure se termine en moins de 1 minutes; des fichiers plus longs font la file d'attente et les avisent par courrier électronique lorsque cela est fait.
Moonshine a 61M paramètres. Les modèles plus grands ont tendance à être plus précis mais plus lents; STT.ai hôtes Moonshine sur GPU de sorte que le nombre de paramètres n'affecte pas les performances de votre client.
Moonshine accepte chaque format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, et autres. Sortie comme TXT, SRT, VTT, DOCX, JSON ou PDF.
Oui. La diarisation des haut-parleurs se déroule aux côtés de Moonshine pour chaque transcription — chaque haut-parleur est étiqueté et vous pouvez les renommer dans l'éditeur par la suite.
Oui. Moonshine fonctionne dans notre environnement géré — l'audio est traité et supprimé par défaut et jamais utilisé pour la formation sans opt-in explicite.
Utilisez l'outil compare-stt pour exécuter Moonshine contre n'importe quel autre modèle pris en charge sur le même son — vous verrez WER, le nombre de segments, les étiquettes des haut-parleurs et les scores de confiance côte à côte. La comparaison Moonshine vs Whisper Large V3 est la plus courante.
Oui. Spécifiez "moonshine" comme paramètre de modèle sur le paramètre /v1/transcrire. Les SDKs Python et Node.js incluent Moonshine exemples. Le niveau d'API gratuit comprend 100 minutes/mois.
Oui. Parce que Moonshine est MIT-licenced, vous pouvez auto-héberger. STT.ai's open-source page liste la prise en charge du projet et les poids. La plupart des équipes de production utilisent notre version hébergée pour sauter l'approvisionnement GPU, les swaps de modèles, et les ops.