报告错误/功能要求

被绑定 SenseVoice

Name: SenseVoice
Author: FunAudioLLM

使用公开的音频和视频工作。 DRM 保护的内容不支持。

增强的升级

私人笔记

与笔录聊天

以 Pro 解锁 →

在此拖放文件或单击以浏览文件

MP3、WAV、M4A、FLAC、MP4、MKV、MOV、WebM-至多2GB

批次上传多个文件与 Pro 合

增强的升级

私人笔记

与笔录聊天

以 Pro 解锁 →

增强的升级

文本的实时演讲。 AI 自动校正, 使用较长的演讲, 准确性会提高。

先测试一下麦克风

每天10分钟免费 600分钟免费,有注册无信用卡已加密

免费签名 →

5.5%

WER

语文

50.0x

速度

MIT

许可证

关于 SenseVoice

SenseVoice是来自FunAudioLLM的演讲基础模型,它超越了抄录。它支持50+语言,包括感应识别能力、音频事件探测能力以及单一模式的反文字正常化能力。

支持的语文 SenseVoice

英语

西班牙语

法语

德语

中文

日语

韩语

葡萄牙语

阿拉伯语

印地语

俄语

意大利语

荷兰语

土耳其语

波兰语

瑞典语

印度尼西亚语

泰语

越南语

捷克语

希腊语

罗马尼亚语

匈牙利语

希伯来语

丹麦语

芬兰语

挪威语

乌克兰语

马来语

孟加拉语

模型信息

提供者FunAudioLLM
建筑结构-
许可证MIT
更新Mar 2026

常见问题

SenseVoice是FunAudioLLM.STT.ai主机SenseVoice在我们的GPU基础设施上的语音对文本模型,这样你就可以在不提供硬件的情况下使用它——上传音频或视频,并从模型采集器中提取SenseVoice。

根据标准基准,SenseVoice人达到约5.5%的字错误率。现实世界的准确性取决于音质、口音和语言;对于吵闹或口音录音,预期WER会高出几个百分点。

SenseVoice年免费运行STT.ai年,每个访客都有600分钟免费启动。付费计划增加了每个文件的上限、私人记录和排队优先。

SenseVoice根据MIT号许可开放源码许可证发放。您可以通过自己的硬件自行托管SenseVoice,或者使用我们的托管版本,这两种版本都可以在商业上使用。

SenseVoice 支持 50 种语言。自动检测为大多数音频选择正确的语言;您也可以手动指定小精度升降。

SenseVoice 处理我们GPUs上大约50.0x的实时音频。 1小时的音频文件在1分钟内完成; 较长的文件排队, 完成后通过电子邮件通知。

SenseVoice 具有 234M 参数。大模型往往更准确,但更慢; STT.ai 主机在 GPU SenseVoice GPU 上, 所以参数计数不会影响您的客户端性能。

SenseVoice 接受每种格式的 STT.ai 支持 - MP3、 WAV、 M4A、 FLAC、 OGG、 MP4、 MKV、 MOV、 WebM、 AVI 等。输出为 TXT、 SRT、 VTT、 DOCX、 JSON 或 PDF 。

是的,议长对音响的对称与每部抄录的88 000次相加——每个发言者都贴上标签,然后可以在编辑中重新命名。

有88 000次运行在我们的管理环境中——音频被默认地处理和删除,在没有明确选择使用的情况下从不用于培训。

使用对比工具运行 SenseVoice 相对于同一音频上的其他支持模式, 您可以看到 WER 、区段计数、扬声标签和信任度, 并肩得分。最常用的比对是 SenseVoice vs Whiseper large V3 比较。

是, 请指定“ sensevoice” 为 / v1/ trancant 端点上的模型参数。 Python 和 Node.js SDKs 包括 SenseVoice 个示例。免费 API 级包括 100 分钟/ 月。

是的,因为SenseVoice有MIT的许可证,你可以自行托管它。STT.ai的开放源码页面列出了项目回购和重量。大多数生产团队使用我们的主机版本来跳过GPU采购、模型互换和操作。

被绑定 SenseVoice

关于 SenseVoice

支持的语文 SenseVoice

模型信息

相关模式

常见问题

什么是SenseVoice?

SenseVoice的准确度是多少?

SenseVoice可以免费使用吗?

SenseVoice使用什么执照?

SenseVoice支持多少种语言?

SenseVoice的速度有多快?

SenseVoice型号有多大?

SenseVoice 抄录的音频格式是什么?

88,000 是否检测到多个喇叭?

使用SenseVoice数据时我的数据是保密的吗?

SenseVoice与其他STT模型相比如何?

我可以通过APISenseVoice吗?

我能用自己的服务器运行SenseVoice吗?