Công cụ chuyển đổi trực tuyến miễn phí
Tải tệp lên, ghi âm hoặc dán URL. AI chuyển đổi trong vài giây.
100+ ngôn ngữ
Tự động nhận diện hoặc chọn. Hỗ trợ mọi ngôn ngữ chính.
Nhận diện người nói
Tự động xác định ai nói gì.
Mã hóa phía máy khách
Mã hóa bản ghi ngay trên trình duyệt. Ngay cả chúng tôi cũng không đọc được.
6 định dạng xuất
TXT, SRT, VTT, DOCX, JSON, PDF.
Cách hoạt động
1
Tải lên hoặc ghi âm
Tải tệp âm thanh/video, dán URL hoặc ghi âm từ micro.
2
AI chuyển đổi
Chọn từ nhiều mô hình AI. Tự động nhận diện ngôn ngữ và người nói.
3
Xuất & chia sẻ
Tải xuống dưới dạng TXT, SRT, VTT, DOCX, JSON hoặc PDF. Chia sẻ bằng liên kết.
Câu hỏi thường gặp
Tải tập tin âm thanh hay video lên STT.ai, dán URL, hoặc ghi trực tiếp. Chọn mô hình AI thích hợp và nhấn vào Transcribe. Hầu hết các tập tin hoàn thành trong 5 phút. Xuất sang dạng TXT, SRT, VTT, DOCX, JSON, hoặc PDF.
Có — STT.ai cho mỗi người truy cập 600 phút miễn phí/tháng mà không cần đăng ký cho tập tin đầu tiên của bạn. Các kế hoạch trả tiền bắt đầu từ $5/tháng mở khóa các tập tin dài hơn, bản ghi riêng và xếp hàng ưu tiên.
Độ chính xác phụ thuộc vào mô hình và chất lượng âm thanh. Các mô hình tốt nhất của chúng tôi đạt đến 3- 5% Tỷ lệ sai từ trong các tiêu chuẩn — 95- 97% độ chính xác trong giọng nói rõ ràng. Công cụ so sánh- stt cho phép bạn chạy nhiều mô hình trên cùng một tập tin và chọn cái tốt nhất.
STT.ai cung cấp 10+ mẫu — STT.ai Enhanced (của chúng tôi chính xác nhất), Whisper Large V3 (99 ngôn ngữ), NVIDIA Canary (#1 WER trên các lang được hỗ trợ), Whisper Turbo (nhanh), Moonshine (nhẹ), và nhiều hơn nữa.
Có. Xuất bản bản ghi của bạn thành tập tin phụ đề SRT hoặc VTT — chúng hoạt động với YouTube, Vimeo, TikTok, VLC, và mọi trình xem video lớn. Công cụ ghi phụ đề sẽ phủ chúng lên video như các phụ đề cứng.
Có. Tính toán ngày của loa tự động dán nhãn mỗi giọng nói (Loa 1, Loa 2,...) và bạn có thể đổi tên chúng trong trình biên tập. Hoạt động trên tất cả các mẫu và ngôn ngữ.
Hầu hết các tập tin được phiên âm trong chưa đến 5 phút. Một tập tin âm thanh 1 giờ thường được hoàn thành trong 2- 3 phút với các mẫu nhanh nhất của chúng tôi. Tốc độ phụ thuộc vào lựa chọn mẫu và tải lượng hiện tại.
STT.ai hỗ trợ 20+ định dạng đầu vào — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI và các định dạng khác.
Có. Các tập tin âm thanh được xử lý và xóa theo mặc định. Các gói Pro thêm mã hóa bên khách — ngay cả khi cơ sở dữ liệu của chúng tôi bị phá vỡ, bản ghi của bạn không thể đọc được nếu không có chìa khóa của bạn. Dữ liệu không bao giờ được sử dụng cho việc huấn luyện mô hình mà không có sự đồng ý rõ ràng.
Có. STT.ai cung cấp một API REST với Python và Node.js SDKs, cộng thêm một máy chủ MCP cho Claude và Cursor.
Có. Mỗi bản ghi sẽ được mở trong trình biên tập bên trong nơi bạn có thể sửa chữa từ, đổi tên người nói, điều chỉnh dấu thời gian, và thêm ghi chú. Tất cả các thay đổi sẽ được lưu tự động.
Mỗi bản ghi nhận sẽ có một URL có thể chia sẻ duy nhất. Xuất sang DOCX hoặc PDF để gửi qua thư điện tử. Các kế hoạch chuyên nghiệp thêm liên kết bảo vệ bằng mật khẩu và liên kết vĩnh viễn — hữu ích cho công việc khách hàng.
STT.ai hỗ trợ 1.300+ nền tảng bao gồm YouTube, Vimeo, TikTok, SoundCloud, và nhiều hơn nữa. URL transcription works with publicly-available content only — DRM-protected sources cannot be transcribed.