免费在线转录工具
上传文件、使用麦克风录音或粘贴链接。AI 几秒内完成转录。
100+ 种语言
自动检测或手动选择。支持所有主要语言。
说话人识别
自动识别每个人的发言。
客户端加密
在浏览器中加密转录。即使我们也无法读取。
6 种导出格式
TXT、SRT、VTT、DOCX、JSON、PDF。
工作原理
1
上传或录音
上传音频/视频文件,粘贴 YouTube 或任何平台的链接,或使用麦克风录音。
2
AI 转录
从多个 AI 模型中选择。自动检测语言。说话人分离功能可识别每个人的发言。
3
导出与分享
下载为 TXT、SRT、VTT、DOCX、JSON 或 PDF。通过链接分享。使用 AI 增强以提高准确性。
常问问题
上传您的音频或视频文件到 STT.ai, 粘贴一个 URL, 或现场录制。 选择您首选的 AI 模型并单击 Transcript。 大多数文件在5分钟内完成。 导出为 TXT、 SRT、 VTT、 DOCX、 JSON 或 PDF 。
是 — STT.ai给每个访客600分钟/月的自由时间,而第一个文件不需要注册。 支付计划从5美元/月打开更长的文件、私人笔录和优先排队开始。
准确性取决于模型和音频质量。 我们的最佳模型在基准值上达到3-5%的字错误率 — — 清洁语言精确度为95-97%。 比较工具允许您在同一文档上运行多个模型并选择最佳的模型 。
STT.ai提供10+模型——STT.ai增强型(我们最精确)、低声大V3(99种语言)、NVIDIA加那利语(#1 WER on succept sangs)、Whiseper Turbo(快)、月光(轻量级)等等。
是的,将您的记录稿导出为 SRT 或 VTT 字幕文件—— 他们与YouTube、Vimeo、TikTok、VLC 和每个主要视频播放器合作, 燃烧字幕工具将它们作为硬子覆盖到视频中。
是的。 议长对角化自动标出每个声音( 发言者1, 发言者2,...), 您可以在编辑中重新命名它们。 在所有模式和语言中工作 。
大多数文件在5分钟内被转录。 1小时的音频文件通常以2-3分钟以最快的模型完成。 速度取决于模式选择和当前负荷 。
STT.ai支持20+输入格式——MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVI等。输出到TXT、SRT、VTT、DOCX、JSON和PDF。
是的。 音频文件会默认地被处理和删除。 Pro计划添加客户端加密—— 即使我们的数据库被破坏, 您的笔录没有您的密钥是无法读取的。 数据不会在没有明确选入的情况下用于示范培训 。
是 STT.ai 向Python和Node.js SDKs提供REST API,加上Claude和Cursor的 MCP服务器,免费API级别包括每月100分钟。
是的,每一份笔录都打开在我们的内置编辑器中,您可以在其中纠正单词、重命名扬声器、调整时间戳和添加笔记。所有更改都自动保存 。
每一份誊本都有一个独特的可分享的URL。 输出到 DOCX 或 PDF 用于电子邮件。 Pro 计划添加密码保护和长期链接, 用于客户工作 。
STT.ai支持1 300+平台,包括YouTube、Vimeo、TikTok、SoundCloud等平台。 URL转录只使用公开可用的内容,DRM保护的来源不能转录。