Транскрибировать с Moonshine
7.8%
WER
1
Languages
80.0x
Speed
MIT
License
О модели Moonshine
Moonshine is an extremely compact speech-to-text model designed for resource-constrained environments. At only 61M parameters, it runs efficiently on edge devices like Raspberry Pi while maintaining reasonable English transcription accuracy.
Поддерживаемые языки Moonshine
Model Info
- ProviderUseful Sensors
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Часто задаваемые вопросы
Moonshine — это речевая модель на Useful Sensors. STT.ai носит Moonshine на нашей инфраструктуре GPU, так что вы можете использовать ее без обеспечения собственного оборудования — загружать аудио- или видео и выбирать Moonshine из сборщика модели.
При стандартных контрольных параметрах Moonshine достигает примерно 7.8% скорости ошибок в Word. Точность в реальном мире зависит от качества звука, акцента и языка; для шумных или заостренных записей ожидается, что на несколько процентных пунктов выше WER.
Moonshine работает на бесплатном уровне STT.ai — каждый посетитель получает 600 минут в месяц бесплатно.
Moonshine выпущено на MIT год, разрешительная лицензия с открытым исходным кодом. Вы можете самостоятельно принять Moonshine на вашем собственном оборудовании или использовать нашу приёмную версию — оба они могут быть использованы на коммерческой основе.
Moonshine поддерживает 1 язык. Автообнаружение выбирает правильный язык для большинства звуков; вы также можете указать его вручную для небольшого лифта с точностью.
Moonshine обрабатывает аудио примерно 80.0x в режиме реального времени на наших GPU. 1-часовой аудио файл заканчивается меньше чем за 1 минуты; более длинный список файлов и уведомление по электронной почте, когда он будет сделан.
Moonshine имеет параметры 61M. Большие модели, как правило, более точны, но медленнее; STT.ai носит Moonshine на GPU, так что число параметров не влияет на производительность вашего клиента.
Moonshine принимает каждый формат STT.ai поддержки — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI и другие.
Да, диааризация спикера проводится вместе с Moonshine за каждую транскрипцию — каждый оратор помечен ярлыком, и после этого вы можете переименовать их в редактора.
Да. Moonshine прогонов в нашей регулируемой среде — аудио обрабатывается и удаляется по умолчанию и никогда не используется для обучения без прямого выбора. Про-планы добавляют шифрование клиентом для расшифровки стенограмм.
Используйте инструмент для сравнения с Moonshine против любой другой поддерживаемой модели на одном и том же аудио — вы увидите WER, число сегментов, ярлыки громкостей и оценки достоверности одновременно. Сопоставление Moonshine vs Whisper Крупный V3 — наиболее частое сравнение.
Да. Указать "moonshine" в качестве параметра модели на конечных точках /v1/tranarip. Python и Node.js SDKs включают Moonshine примеры. Свободный API уровень включает 100 минут в месяц.
Да, так как Moonshine имеет MIT-лицензию, вы можете самостоятельно завести его. На странице с открытым исходным кодом STT.ai перечисляются репо и весы проекта. Большинство производственных команд используют нашу хост-версия, чтобы пропустить закупки GPU, свопы моделей и операции.