报告错误/功能要求

被绑定 Moonshine

Name: Moonshine
Author: Useful Sensors

使用公开的音频和视频工作。 DRM 保护的内容不支持。

增强的升级

私人笔记

与笔录聊天

以 Pro 解锁 →

在此拖放文件或单击以浏览文件

MP3、WAV、M4A、FLAC、MP4、MKV、MOV、WebM-至多2GB

批次上传多个文件与 Pro 合

增强的升级

私人笔记

与笔录聊天

以 Pro 解锁 →

增强的升级

文本的实时演讲。 AI 自动校正, 使用较长的演讲, 准确性会提高。

先测试一下麦克风

每天10分钟免费 600分钟免费,有注册无信用卡已加密

免费签名 →

7.8%

WER

语文

80.0x

速度

MIT

许可证

关于 Moonshine

月光是一种为资源受限环境设计的极其紧凑的语音到文字模型。它只有61M参数,有效运行在Raspberry Pi等边缘设备上,同时保持合理的英文抄写准确性。

支持的语文 Moonshine

英语

模型信息

提供者Useful Sensors
建筑结构-
许可证MIT
更新Mar 2026

常见问题

Moonshine是Useful Sensors.STT.ai主机Moonshine在我们的GPU基础设施上的语音对文本模型,这样你就可以在不提供硬件的情况下使用它——上传音频或视频,并从模型采集器中提取Moonshine。

根据标准基准,Moonshine人达到约7.8%的字错误率。现实世界的准确性取决于音质、口音和语言;对于吵闹或口音录音,预期WER会高出几个百分点。

Moonshine年免费运行STT.ai年,每个访客都有600分钟免费启动。付费计划增加了每个文件的上限、私人记录和排队优先。

Moonshine根据MIT号许可开放源码许可证发放。您可以通过自己的硬件自行托管Moonshine,或者使用我们的托管版本,这两种版本都可以在商业上使用。

Moonshine 支持 1 种语言。自动检测为大多数音频选择正确的语言;您也可以手动指定小精度升降。

Moonshine 处理我们GPUs上大约80.0x的实时音频。 1小时的音频文件在1分钟内完成; 较长的文件排队, 完成后通过电子邮件通知。

Moonshine 具有 61M 参数。大模型往往更准确,但更慢; STT.ai 主机在 GPU Moonshine GPU 上, 所以参数计数不会影响您的客户端性能。

Moonshine 接受每种格式的 STT.ai 支持 - MP3、 WAV、 M4A、 FLAC、 OGG、 MP4、 MKV、 MOV、 WebM、 AVI 等。输出为 TXT、 SRT、 VTT、 DOCX、 JSON 或 PDF 。

是的,议长对音响的对称与每部抄录的88 000次相加——每个发言者都贴上标签,然后可以在编辑中重新命名。

有88 000次运行在我们的管理环境中——音频被默认地处理和删除,在没有明确选择使用的情况下从不用于培训。

使用对比工具运行 Moonshine 相对于同一音频上的其他支持模式, 您可以看到 WER 、区段计数、扬声标签和信任度, 并肩得分。最常用的比对是 Moonshine vs Whiseper large V3 比较。

是, 请指定“ moonshine” 为 / v1/ trancant 端点上的模型参数。 Python 和 Node.js SDKs 包括 Moonshine 个示例。免费 API 级包括 100 分钟/ 月。

是的,因为Moonshine有MIT的许可证,你可以自行托管它。STT.ai的开放源码页面列出了项目回购和重量。大多数生产团队使用我们的主机版本来跳过GPU采购、模型互换和操作。

被绑定 Moonshine

关于 Moonshine

支持的语文 Moonshine

模型信息

相关模式

常见问题

什么是Moonshine?

Moonshine的准确度是多少?

Moonshine可以免费使用吗?

Moonshine使用什么执照?

Moonshine支持多少种语言?

Moonshine的速度有多快?

Moonshine型号有多大?

Moonshine 抄录的音频格式是什么?

88,000 是否检测到多个喇叭?

使用Moonshine数据时我的数据是保密的吗?

Moonshine与其他STT模型相比如何?

我可以通过APIMoonshine吗?

我能用自己的服务器运行Moonshine吗?