转录 STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
关于 STT.ai Enhanced
STT.ai Enhanced is our most accurate and fastest speech-to-text model. Built on cutting-edge transformer architecture with proprietary optimizations, it delivers industry-leading word error rates across 100+ languages. Ideal for production transcription, real-time captioning, and enterprise applications.
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
常见问题
STT.ai Enhanced是STT.ai.STT.ai主机STT.ai Enhanced在我们的GPU基础设施上的语音对文本模型,这样你就可以在不提供硬件的情况下使用它——上传音频或视频,并从模型采集器中提取STT.ai Enhanced。
根据标准基准,STT.ai Enhanced人达到约3.2%的字错误率。 现实世界的准确性取决于音质、口音和语言;对于吵闹或口音录音,预期WER会高出几个百分点。
STT.ai Enhanced is a premium model — included with any paid STT.ai plan starting at $5/month. Free users can preview STT.ai Enhanced on short clips; longer files require an active plan.
STT.ai Enhanced is distributed under Proprietary. STT.ai's hosted version handles the licensing compliance for you so commercial use through our service is straightforward.
STT.ai Enhanced 支持 100 种语言。自动检测为大多数音频选择正确的语言;您也可以手动指定小精度升降。
STT.ai Enhanced 处理我们GPUs上大约160.0x的实时音频。 1小时的音频文件在1分钟内完成; 较长的文件排队, 完成后通过电子邮件通知 。
STT.ai Enhanced 具有 1.5B 参数。 大模型往往更准确,但更慢; STT.ai 主机在 GPU STT.ai Enhanced GPU 上, 所以参数计数不会影响您的客户端性能 。
STT.ai Enhanced 接受每种格式的 STT.ai 支持 - MP3、 WAV、 M4A、 FLAC、 OGG、 MP4、 MKV、 MOV、 WebM、 AVI 等。 输出为 TXT、 SRT、 VTT、 DOCX、 JSON 或 PDF 。
是的,议长对音响的对称与每部抄录的88 000次相加——每个发言者都贴上标签,然后可以在编辑中重新命名。
是的,STT.ai Enhanced在我们的私人基础设施中运行——音频被默认地处理和删除。Pro+添加客户端加密,这样笔录就无法读取,没有您的密钥,二等兵云云让你在自己的VPC中完全自行托管STT.ai Enhanced。
使用对比工具运行 STT.ai Enhanced 相对于同一音频上的其他支持模式, 您可以看到 WER 、 区段计数、 扬声标签和信任度, 并肩得分 。 最常用的比对是 STT.ai Enhanced vs Whiseper large V3 比较 。
是, 请指定“ stt-ai-enhanced” 为 / v1/ trancant 端点上的模型参数。 Python 和 Node.js SDKs 包括 STT.ai Enhanced 个示例。 免费 API 级包括 100 分钟/ 月 。
STT.ai Enhanced的许可由STT.ai确定;自行托管取决于其条件。 STT.ai的托管服务在管理 GPU 上运行STT.ai Enhanced, 这样您就不需要处理这种整合。