Tải tập tin âm thanh hay video lên STT.ai, dán URL, hoặc ghi trực tiếp. Chọn mô hình AI thích hợp và nhấn vào Transcribe. Hầu hết các tập tin hoàn thành trong 5 phút. Xuất sang dạng TXT, SRT, VTT, DOCX, JSON, hoặc PDF.

Có — STT.ai cho mỗi người truy cập 600 phút miễn phí/tháng mà không cần đăng ký cho tập tin đầu tiên của bạn. Các kế hoạch trả tiền bắt đầu từ $5/tháng mở khóa các tập tin dài hơn, bản ghi riêng và xếp hàng ưu tiên.

Độ chính xác phụ thuộc vào mô hình và chất lượng âm thanh. Các mô hình tốt nhất của chúng tôi đạt đến 3- 5% Tỷ lệ sai từ trong các tiêu chuẩn — 95- 97% độ chính xác trong giọng nói rõ ràng. Công cụ so sánh- stt cho phép bạn chạy nhiều mô hình trên cùng một tập tin và chọn cái tốt nhất.

STT.ai cung cấp 10+ mẫu — STT.ai Enhanced (của chúng tôi chính xác nhất), Whisper Large V3 (99 ngôn ngữ), NVIDIA Canary (#1 WER trên các lang được hỗ trợ), Whisper Turbo (nhanh), Moonshine (nhẹ), và nhiều hơn nữa.

Có. Xuất bản bản ghi của bạn thành tập tin phụ đề SRT hoặc VTT — chúng hoạt động với YouTube, Vimeo, TikTok, VLC, và mọi trình xem video lớn. Công cụ ghi phụ đề sẽ phủ chúng lên video như các phụ đề cứng.

Có. Tính toán ngày của loa tự động dán nhãn mỗi giọng nói (Loa 1, Loa 2,...) và bạn có thể đổi tên chúng trong trình biên tập. Hoạt động trên tất cả các mẫu và ngôn ngữ.

Hầu hết các tập tin được phiên âm trong chưa đến 5 phút. Một tập tin âm thanh 1 giờ thường được hoàn thành trong 2- 3 phút với các mẫu nhanh nhất của chúng tôi. Tốc độ phụ thuộc vào lựa chọn mẫu và tải lượng hiện tại.

STT.ai hỗ trợ 20+ định dạng đầu vào — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI và các định dạng khác.

Có. Các tập tin âm thanh được xử lý và xóa theo mặc định. Các gói Pro thêm mã hóa bên khách — ngay cả khi cơ sở dữ liệu của chúng tôi bị phá vỡ, bản ghi của bạn không thể đọc được nếu không có chìa khóa của bạn. Dữ liệu không bao giờ được sử dụng cho việc huấn luyện mô hình mà không có sự đồng ý rõ ràng.

Có. STT.ai cung cấp một API REST với Python và Node.js SDKs, cộng thêm một máy chủ MCP cho Claude và Cursor.

Có. Mỗi bản ghi sẽ được mở trong trình biên tập bên trong nơi bạn có thể sửa chữa từ, đổi tên người nói, điều chỉnh dấu thời gian, và thêm ghi chú. Tất cả các thay đổi sẽ được lưu tự động.

Mỗi bản ghi nhận sẽ có một URL có thể chia sẻ duy nhất. Xuất sang DOCX hoặc PDF để gửi qua thư điện tử. Các kế hoạch chuyên nghiệp thêm liên kết bảo vệ bằng mật khẩu và liên kết vĩnh viễn — hữu ích cho công việc khách hàng.

STT.ai hỗ trợ 1.300+ nền tảng bao gồm YouTube, Vimeo, TikTok, SoundCloud, và nhiều hơn nữa. URL transcription works with publicly-available content only — DRM-protected sources cannot be transcribed.

Công cụ chuyển đổi trực tuyến miễn phí

Định dạng âm thanh & video hỗ trợ

Cách hoạt động

Tải lên hoặc ghi âm

AI chuyển đổi

Xuất & chia sẻ

Câu hỏi thường gặp

Làm sao tôi có thể chuyển âm thanh với STT.ai?

Is STT.ai free?

How accurate is STT.ai's transcription?

What AI models can I use?

Can I get subtitles and captions?

Does STT.ai detect different speakers?

How long does transcription take?

What file formats are supported?

Is my audio data kept private?

Tôi có thể truy cập phiên dịch qua API không?

Can I edit the transcript after?

How do I share my transcript?

What URLs and platforms are supported?