工作原理
三个步骤即可启动运行。
1. 部署
我们在您首选的区域配置专用 GPU 服务器,或在您自己的硬件上部署我们的 Docker 镜像。设置时间不到24小时。
2. 转录
使用您熟悉的 STT.ai API 和网页界面。音频完全在您的专用服务器上处理,不会发送到共享基础设施。
3. 导出
转录文本保留在您的服务器上。可导出为 TXT、SRT、VTT、DOCX、JSON 或 PDF。通过 API 与您现有的系统集成。
选择您的部署方式
| 功能 | 共享云 | 私有云 | 自托管许可证 |
|---|---|---|---|
| 起始价格 | $0 - $39/以 单位 | $499/以 单位 | $99/以 单位 |
| 基础设施 | 共享 GPU | 专用 GPU | 您自己的 GPU |
| 数据位置 | 我们的服务器 | 您选择的区域 | 您的场所 |
| 气隙部署支持 | |||
| SLA | |||
| 完全托管 | 您自行管理 | ||
| 无限分钟数 |
为受监管行业而建
当合规要求音频不得离开您的基础设施时。
医疗保健
符合 HIPAA 标准的患者录音、临床笔记和远程医疗会话转录。
法律
证词、法庭录音和特权通信留在您的律所内部。
政府
在气隙网络上转录机密或敏感简报。完全的数据主权。
金融
在本地处理财报电话会议、合规录音和交易大厅音频。
定价
私有云
$499/以 单位
您自己的专用 GPU 服务器。音频永远不会离开您的基础设施。真正的端到端隐私。
- 专用 A100 GPU
- 隔离服务器——无共享基础设施
- 音频仅在您的硬件上处理
- 完整 API 访问 + SLA
- 无限分钟数
自托管许可证
$99/以 单位
在您自己的硬件上运行 STT.ai。Docker 镜像,您的服务器,您做主。
- Docker 镜像——可在任何 NVIDIA GPU 上运行
- 气隙部署支持——无需互联网
- 包含模型更新
- 完全控制您的数据
- 无限分钟数
常问问题
将音频或视频文件上传到STT.ai,选择AI模型和选项,点击转录。几分钟内即可获得结果。可导出为TXT、SRT、VTT、DOCX、JSON或PDF。
是的!STT.ai为所有用户每月提供600分钟免费。首次转录无需注册。付费方案起价$5/月。
准确性取决于AI模型和音频质量。我们最好的模型在基准测试中达到5-7%的词错误率,即93-95%以上的准确率。
STT.ai 提供10+模型, 包括Whiseper large V3、 NVIDIA 加那利等。 您可以比较同一文档中不同模型的结果 。
是的, 在转录后, 将您的记录稿导出为 SRT 或 VTT 字幕文件。 这些与YouTube、 Vimeo 和所有主要视频平台有关 。
是的, STT.ai 自动识别并标出使用 AI 演讲者对称法的不同演讲者, 在所有模式和语言上都有效。
大部分文件在5分钟内被转录。一个1小时的音频文件通常需要2-3分钟与我们最快的模型。
STT.ai 支持20+音频和视频格式,包括MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM和AVI等MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM和AVI。
是的。 音频文件在转录后被处理和删除。 您的数据从不用于培训。 客户端加密在所有计划中都是免费的—— 它加密存储记录誊本, 只有您的密钥。 在处理过程中, 服务器会用普通文本处理您的音频 。 了解我们的安全措施.
是的,STT.ai 提供Python和Node.js SDKs的REST API。
是的。 STT.ai 包含一个内置的抄录编辑器, 您可以更正错误, 重命名扬声器, 并调整时间戳 。
每一份笔录都有一个独特的共享链接。 输出到 DOCX 或 PDF 用于电子邮件。 Pro 计划提供有密码保护的永久链接 。
STT.ai supports 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, and more. URL transcription works only with publicly available audio and video. DRM-protected content (such as Spotify premium episodes, Netflix, Disney+, etc.) cannot be transcribed. For DRM content, download the file separately and upload it directly.