Transcribir con Moonshine
7.8%
WER
1
Languages
80.0x
Speed
MIT
License
Acerca de Moonshine
Moonshine is an extremely compact speech-to-text model designed for resource-constrained environments. At only 61M parameters, it runs efficiently on edge devices like Raspberry Pi while maintaining reasonable English transcription accuracy.
Idiomas compatibles con Moonshine
Model Info
- ProviderUseful Sensors
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Preguntas frecuentes
Moonshine es un modelo de voz a texto de Useful Sensors. STT.ai aloja Moonshine en nuestra infraestructura de GPU para que pueda usarlo sin aprovisionamiento de su propio hardware — subir audio o vídeo y elegir Moonshine del selector de modelos.
En puntos de referencia estándar, Moonshine alcanza alrededor de 7.8% tasa de error de Word. La precisión en el mundo real depende de la calidad de audio, el acento y el lenguaje; para grabaciones ruidosas o acentuadas, espere unos puntos porcentuales más alto WER.
Moonshine funciona en el nivel gratuito de STT.ai — cada visitante recibe 600 minutos / mes sin costo. Los planes pagados añaden límites por archivo más largos, transcripciones privadas y cola de prioridad.
Moonshine es lanzado bajo MIT, una licencia de código abierto permisiva. Usted puede auto-anfitriona Moonshine en su propio hardware o utilizar nuestra versión alojada — ambos son comercialmente utilizables.
Moonshine admite 1 idiomas. La detección automática selecciona el idioma adecuado para la mayoría de audio; también puede especificarlo manualmente para un pequeño ascensor de precisión.
Moonshine procesa audio en aproximadamente 80.0x en tiempo real en nuestras GPUs. Un archivo de audio de 1 hora termina en menos de 1 minutos; los archivos más largos cola y notificar por correo electrónico cuando se hace.
Moonshine tiene parámetros 61M. Los modelos más grandes tienden a ser más precisos pero más lentos; STT.ai aloja Moonshine en GPU para que el recuento de parámetros no afecte el rendimiento de su cliente.
Moonshine acepta todos los soportes de formato STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, y otros. Salida como TXT, SRT, VTT, DOCX, JSON o PDF.
Sí. Diarización del altavoz corre junto a Moonshine para cada transcripción - cada altavoz está etiquetado y se puede cambiar el nombre en el editor después.
Sí. Moonshine se ejecuta en nuestro entorno gestionado — audio se procesa y elimina por defecto y nunca se utiliza para el entrenamiento sin opt-in explícito. Planes Pro añadir cifrado del lado del cliente para transcripciones en reposo.
Utilice la herramienta compare-stt para ejecutar Moonshine contra cualquier otro modelo soportado en el mismo audio: verá WER, conteo de segmentos, etiquetas de altavoz y puntuaciones de confianza lado a lado. La comparación Moonshine vs Whisper Large V3 es la más común.
Sí. Especifique "moonshine" como parámetro de modelo en el endpoint /v1/transcribir. Los SDKs de Python y Node.js incluyen Moonshine ejemplos. El nivel de API libre incluye 100 minutos/mes.
Sí. Debido a que Moonshine es licenciada MIT, usted puede auto-anfitrionarlo. STT.ai's página de código abierto lista la repo proyecto y pesos. La mayoría de los equipos de producción utilizan nuestra versión alojada para saltarse la adquisición de GPU, modelos swaps, y ops.