报告错误/功能要求

被绑定 Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

使用公开的音频和视频工作。 DRM 保护的内容不支持。

增强的升级

私人笔记

与笔录聊天

以 Pro 解锁 →

在此拖放文件或单击以浏览文件

MP3、WAV、M4A、FLAC、MP4、MKV、MOV、WebM-至多2GB

批次上传多个文件与 Pro 合

增强的升级

私人笔记

与笔录聊天

以 Pro 解锁 →

增强的升级

文本的实时演讲。 AI 自动校正, 使用较长的演讲, 准确性会提高。

先测试一下麦克风

每天10分钟免费 600分钟免费,有注册无信用卡已加密

免费签名 →

5.8%

WER

语文

48.0x

速度

MIT

许可证

关于 Distil-Whisper

窃听器是用抱抱脸制作的私语的蒸馏版本。它将模型大小减少49%, 并实现6x更快的推论, 同时在分配外评价组中将原 Whiseper 大V2 的1% WER 内保持不变。

支持的语文 Distil-Whisper

英语

西班牙语

法语

德语

中文

日语

韩语

葡萄牙语

阿拉伯语

印地语

俄语

意大利语

荷兰语

土耳其语

波兰语

瑞典语

印度尼西亚语

泰语

越南语

捷克语

希腊语

罗马尼亚语

匈牙利语

希伯来语

丹麦语

芬兰语

挪威语

乌克兰语

马来语

孟加拉语

模型信息

提供者Hugging Face
建筑结构-
许可证MIT
更新Mar 2026

常见问题

Distil-Whisper是Hugging Face.STT.ai主机Distil-Whisper在我们的GPU基础设施上的语音对文本模型,这样你就可以在不提供硬件的情况下使用它——上传音频或视频,并从模型采集器中提取Distil-Whisper。

根据标准基准,Distil-Whisper人达到约5.8%的字错误率。现实世界的准确性取决于音质、口音和语言;对于吵闹或口音录音,预期WER会高出几个百分点。

Distil-Whisper年免费运行STT.ai年,每个访客都有600分钟免费启动。付费计划增加了每个文件的上限、私人记录和排队优先。

Distil-Whisper根据MIT号许可开放源码许可证发放。您可以通过自己的硬件自行托管Distil-Whisper,或者使用我们的托管版本,这两种版本都可以在商业上使用。

Distil-Whisper 支持 99 种语言。自动检测为大多数音频选择正确的语言;您也可以手动指定小精度升降。

Distil-Whisper 处理我们GPUs上大约48.0x的实时音频。 1小时的音频文件在1分钟内完成; 较长的文件排队, 完成后通过电子邮件通知。

Distil-Whisper 具有 756M 参数。大模型往往更准确,但更慢; STT.ai 主机在 GPU Distil-Whisper GPU 上, 所以参数计数不会影响您的客户端性能。

Distil-Whisper 接受每种格式的 STT.ai 支持 - MP3、 WAV、 M4A、 FLAC、 OGG、 MP4、 MKV、 MOV、 WebM、 AVI 等。输出为 TXT、 SRT、 VTT、 DOCX、 JSON 或 PDF 。

是的,议长对音响的对称与每部抄录的88 000次相加——每个发言者都贴上标签,然后可以在编辑中重新命名。

有88 000次运行在我们的管理环境中——音频被默认地处理和删除,在没有明确选择使用的情况下从不用于培训。

使用对比工具运行 Distil-Whisper 相对于同一音频上的其他支持模式, 您可以看到 WER 、区段计数、扬声标签和信任度, 并肩得分。最常用的比对是 Distil-Whisper vs Whiseper large V3 比较。

是, 请指定“ distil-whisper” 为 / v1/ trancant 端点上的模型参数。 Python 和 Node.js SDKs 包括 Distil-Whisper 个示例。免费 API 级包括 100 分钟/ 月。

是的,因为Distil-Whisper有MIT的许可证,你可以自行托管它。STT.ai的开放源码页面列出了项目回购和重量。大多数生产团队使用我们的主机版本来跳过GPU采购、模型互换和操作。

被绑定 Distil-Whisper

关于 Distil-Whisper

支持的语文 Distil-Whisper

模型信息

相关模式

常见问题

什么是Distil-Whisper?

Distil-Whisper的准确度是多少?

Distil-Whisper可以免费使用吗?

Distil-Whisper使用什么执照?

Distil-Whisper支持多少种语言?

Distil-Whisper的速度有多快?

Distil-Whisper型号有多大?

Distil-Whisper 抄录的音频格式是什么?

88,000 是否检测到多个喇叭?

使用Distil-Whisper数据时我的数据是保密的吗?

Distil-Whisper与其他STT模型相比如何?

我可以通过APIDistil-Whisper吗?

我能用自己的服务器运行Distil-Whisper吗?