Báo cáo lỗi / yêu cầu tính năng

Công cụ chuyển đổi trực tuyến miễn phí

Tải tệp lên, ghi âm hoặc dán URL. AI chuyển đổi trong vài giây.

Làm việc với âm thanh và video công cộng. Không hỗ trợ nội dung được bảo vệ DRM.

Tăng cấp cho nâng cấp

Bản dịch riêng

Trò chuyện với bản ghi chép

Mở khóa với Pro →

Thả tập tin vào đây hoặc nhấn để duyệt

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — lên đến 2GB

Tải lên nhiều tập tin một lúc với Pro

Tăng cấp cho nâng cấp

Bản dịch riêng

Trò chuyện với bản ghi chép

Mở khóa với Pro →

Tăng cấp cho nâng cấp

Tự động sửa lỗi khi bạn nói — độ chính xác tăng lên khi nói lâu hơn.

Kiểm tra micro đầu tiên

10 phút miễn phí/ngày 600 phút miễn phí với đăng ký Không có thẻ tín dụng Đã mã hóa

Đăng ký miễn phí →

100+ ngôn ngữ

Tự động nhận diện hoặc chọn. Hỗ trợ mọi ngôn ngữ chính.

Nhận diện người nói

Tự động xác định ai nói gì.

Mã hóa phía máy khách

Mã hóa bản ghi ngay trên trình duyệt. Ngay cả chúng tôi cũng không đọc được.

6 định dạng xuất

TXT, SRT, VTT, DOCX, JSON, PDF.

Định dạng âm thanh & video hỗ trợ

MP3 WAV M4A FLAC OGG MP4 MKV MOV WebM AVI AAC OPUS WMA

Tải tệp lên đến 2GB. Hỗ trợ 1,300+ nền tảng. Xem tất cả nền tảng →

Làm việc với âm thanh và video công cộng. Không hỗ trợ nội dung được bảo vệ DRM.

Cách hoạt động

Tải lên hoặc ghi âm

Tải tệp âm thanh/video, dán URL hoặc ghi âm từ micro.

AI chuyển đổi

Chọn từ nhiều mô hình AI. Tự động nhận diện ngôn ngữ và người nói.

Xuất & chia sẻ

Tải xuống dưới dạng TXT, SRT, VTT, DOCX, JSON hoặc PDF. Chia sẻ bằng liên kết.

100+ ngôn ngữ

Xem tất cả ngôn ngữ hỗ trợ

Mô hình AI

So sánh Whisper, Canary và hơn thế

API & SDKs

Chuyển đổi lập trình với Python hoặc Node.js

Câu hỏi thường gặp

phiên âm chạy trong trình duyệt của bạn: dán URL, tải lên tập tin, hay ghi âm từ mic của bạn. STT.ai chọn mô hình AI và trả lại bản ghi trong 5 phút. Xuất dạng TXT, SRT, VTT, DOCX, JSON, hoặc PDF.

Có — mỗi khách truy cập có 600 phút miễn phí để bắt đầu trên STT.ai, có thể sử dụng cho phiên âm giống như bất kỳ luồng công việc nào khác. Các kế hoạch trả tiền bắt đầu từ $5/tháng mở khóa các tập tin dài hơn, bản ghi riêng và xếp hàng ưu tiên.

phiên âm chạy trên cùng mô hình AI như phần còn lại của STT.ai — các mô hình tốt nhất của chúng tôi đạt đến độ chính xác 95-97% trong nói rõ (3-5% Tỷ lệ lỗi từ trong các tiêu chuẩn). Thay đổi mô hình khi bay nếu lần đầu đi qua dưới mục tiêu của bạn.

phiên âm có thể chạy trên bất kỳ STT.ai 10+ mẫu — STT.ai Enhanced (đúng nhất), Whisper Large V3 (99 ngôn ngữ), NVIDIA Canary (#1 WER trên langs hỗ trợ), Whisper Turbo (nhanh), Moonshine (nhẹ), và nhiều hơn nữa.

Có. Mỗi bản dịch được xuất thành SRT hoặc VTT — hoạt động với YouTube, Vimeo, TikTok, VLC, và mọi trình xem video lớn. Công cụ ghi phụ đề sẽ đặt chúng lên video như phần phụ đề.

Có. Tự động dán nhãn mỗi giọng nói (Giọng nói 1, Giọng nói 2,...) và bạn có thể đổi tên chúng trong trình biên tập nội bộ. Hoạt động trên tất cả các mẫu và ngôn ngữ.

Hầu hết phiên âm công việc hoàn thành trong 5 phút. Một tập tin âm thanh 1 giờ thường hoàn thành trong 2-3 phút với các mẫu nhanh nhất của chúng tôi. Tốc độ phụ thuộc vào mẫu chọn và tải CPU hiện tại.

phiên âm chấp nhận hơn 20 định dạng — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, và nhiều hơn nữa. Xuất thành TXT, SRT, VTT, DOCX, JSON, hoặc PDF.

Có. Tập tin âm thanh gửi đến phiên âm được xử lý và xóa theo mặc định. Các gói Pro thêm mã hóa bên khách — ngay cả khi cơ sở dữ liệu của STT.ai bị phá vỡ, bản ghi của bạn không đọc được nếu không có chìa khóa của bạn. Dữ liệu không bao giờ được dùng cho việc huấn luyện mô hình nếu không có sự đồng ý rõ ràng.

Có. STT.ai cung cấp một API REST với Python và Node.js SDKs, cộng thêm một máy chủ MCP cho Claude và Cursor — tất cả đều có thể sử dụng cho phiên âm workflows.

Có. Mỗi bản ghi sẽ được mở trong trình biên tập bên trong nơi bạn có thể sửa chữa từ, đổi tên người nói, điều chỉnh dấu thời gian, và thêm ghi chú. Tất cả các thay đổi sẽ được tự động lưu.

Mỗi bản ghi nhận có một URL có thể chia sẻ độc nhất. Xuất DOCX hoặc PDF cho email. Các kế hoạch Pro thêm liên kết bảo vệ mật khẩu và liên kết vĩnh viễn — hữu ích cho công việc khách hàng.

STT.ai xử lý 1.300+ nền tảng bao gồm YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, và nhiều hơn nữa. URL transcription works with publicly-available content only — DRM-protected sources cannot be transcribed.

Công cụ chuyển đổi trực tuyến miễn phí

Định dạng âm thanh & video hỗ trợ

Cách hoạt động

Tải lên hoặc ghi âm

AI chuyển đổi

Xuất & chia sẻ

Câu hỏi thường gặp

phiên âm hoạt động như thế nào trên STT.ai?

phiên âm có sẵn không?

phiên âm chính xác như thế nào?

Tôi có thể dùng những mô hình AI nào cho phiên âm?

Tôi có thể lấy phụ đề từ phiên âm không?

phiên âm có phát hiện ra các loa khác nhau không?

phiên âm mất bao lâu?

phiên âm hỗ trợ định dạng nhập nào?

Âm thanh của tôi có riêng tư khi tôi sử dụng phiên âm không?

Có API phiên âm không?

Tôi có thể chỉnh sửa một bản ghi phiên âm sau không?

Làm thế nào để chia sẻ những gì phiên âm tạo ra?

Những nền tảng nào khác hoạt động ngoài phiên âm?