常问问题
上传您的音频或视频文件到 STT.ai, 粘贴一个 URL, 或现场录制。 选择您首选的 AI 模型并单击 Transcript。 大多数文件在5分钟内完成。 导出为 TXT、 SRT、 VTT、 DOCX、 JSON 或 PDF 。
是 — STT.ai给每个访客600分钟/月的自由时间,而第一个文件不需要注册。 支付计划从5美元/月打开更长的文件、私人笔录和优先排队开始。
准确性取决于模型和音频质量。 我们的最佳模型在基准值上达到3-5%的字错误率 — — 清洁语言精确度为95-97%。 比较工具允许您在同一文档上运行多个模型并选择最佳的模型 。
STT.ai提供10+模型——STT.ai增强型(我们最精确)、低声大V3(99种语言)、NVIDIA加那利语(#1 WER on succept sangs)、Whiseper Turbo(快)、月光(轻量级)等等。
是的,将您的记录稿导出为 SRT 或 VTT 字幕文件—— 他们与YouTube、Vimeo、TikTok、VLC 和每个主要视频播放器合作, 燃烧字幕工具将它们作为硬子覆盖到视频中。
是的。 议长对角化自动标出每个声音( 发言者1, 发言者2,...), 您可以在编辑中重新命名它们。 在所有模式和语言中工作 。
大多数文件在5分钟内被转录。 1小时的音频文件通常以2-3分钟以最快的模型完成。 速度取决于模式选择和当前负荷 。
STT.ai支持20+输入格式——MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVI等。输出到TXT、SRT、VTT、DOCX、JSON和PDF。
是的。 音频文件会默认地被处理和删除。 Pro计划添加客户端加密—— 即使我们的数据库被破坏, 您的笔录没有您的密钥是无法读取的。 数据不会在没有明确选入的情况下用于示范培训 。
是 STT.ai 向Python和Node.js SDKs提供REST API,加上Claude和Cursor的 MCP服务器,免费API级别包括每月100分钟。
是的,每一份笔录都打开在我们的内置编辑器中,您可以在其中纠正单词、重命名扬声器、调整时间戳和添加笔记。所有更改都自动保存 。
每一份誊本都有一个独特的可分享的URL。 输出到 DOCX 或 PDF 用于电子邮件。 Pro 计划添加密码保护和长期链接, 用于客户工作 。
STT.ai支持1 300+平台,包括YouTube、Vimeo、TikTok、SoundCloud等平台。 URL转录只使用公开可用的内容,DRM保护的来源不能转录。