Convert MP3 to Text
Tải lên mp3 100+ ngôn ngữ, phát hiện người nói, ghi thời gian.
About %s MP3
MP3 is the most widely used audio format. Compressed lossy format ideal for music and spoken word. STT.ai accepts MP3 files of any bitrate and sample rate.
Export %s Transcripts As
.TXT
Plain Text
.SRT
Subtitles
.VTT
WebVTT
.DOCX
Word Doc
.JSON
Structured
.PDF
Document
Câu hỏi thường gặp
Tải tập tin âm thanh MP3 (. mp3) lên STT.ai hoặc ghi trực tiếp. Chọn mô hình AI thích hợp và nhấn vào Phép chuyển — hầu hết các tập tin hoàn thành trong 5 phút. Định dạng xuất bao gồm TXT, SRT, VTT, DOCX, JSON và PDF.
Có. STT.ai cho mỗi người truy cập 600 phút miễn phí/tháng cho phiên dịch MP3. Không cần đăng ký cho tập tin đầu tiên. Các gói trả phí bắt đầu từ $5/tháng mở khóa các tập tin dài hơn, nhiều phút hơn, và phiên dịch riêng.
MP3 là định dạng nén có mất, vì vậy các tập tin tốc độ bit rất thấp (dưới 64 kbps) có thể mất vài điểm phần trăm độ chính xác so với WAV hay FLAC không mất. Ở 128 kbps hoặc cao hơn, sự khác biệt là đáng kể và các mẫu tốt nhất của chúng tôi đạt được độ chính xác 93-95%.
Đối với hầu hết các tập tin MP3, STT.ai Enhanced hoặc Whisper Large V3 cho độ chính xác tốt nhất. NVIDIA Canary nhanh hơn với chất lượng tương đương trên các đoạn ngắn hơn. Bạn có thể so sánh kết quả từ nhiều mô hình trên cùng một tập tin trong công cụ compare- stt.
Có. MP3 phiên âm âm thanh hỗ trợ hơn 100 ngôn ngữ. Tự động phát hiện hoạt động cho hầu hết các đoạn phim, hoặc bạn có thể chỉ ra ngôn ngữ nguồn bằng tay để tăng độ chính xác một chút.
Có. Tính toán ngày giờ loa hoạt động trên mọi định dạng được hỗ trợ bao gồm MP3. Mỗi loa được đánh dấu (Loa 1, Loa 2,...) và bạn có thể đổi tên chúng trong trình biên tập sau đó.
Người dùng miễn phí có thể nghe được đến 1 giờ mỗi tập tin; các gói trả phí mở rộng đến 8+ giờ, bao gồm hầu hết các podcast và bài giảng dài.
Có. MP3 tập tin được xử lý và xóa theo mặc định. Các gói Pro thêm mã hóa bên khách hàng — ngay cả khi cơ sở dữ liệu của chúng tôi bị phá vỡ, bản ghi của bạn không thể đọc được nếu không có chìa khóa của bạn. Dữ liệu không bao giờ được sử dụng cho việc huấn luyện mô hình mà không có sự đồng ý rõ ràng.
Có. REST API chấp nhận MP3 tập tin trực tiếp qua điểm kết thúc /v1/transcribe. Python và Node.js SDK bao gồm MP3 ví dụ.
Có. Sau khi phiên âm một tập tin MP3, bạn có thể xuất kết quả thành phụ đề SRT hoặc VTT — hữu ích nếu bạn dự định kết hợp âm thanh với video sau này, hoặc để có thể truy cập vào các trang podcast chỉ có âm thanh.
Có. Mỗi bản ghi sẽ được mở trong trình biên tập nội bộ của chúng tôi, nơi bạn có thể sửa chữa các từ, đổi tên người nói, điều chỉnh dấu thời gian, và thêm ghi chú. Sửa đổi sẽ được lưu trong các bản xuất.
Mỗi bản ghi nhận sẽ có một URL có thể chia sẻ duy nhất. Xuất sang DOCX hoặc PDF để gửi qua thư điện tử, hoặc chia sẻ liên kết trực tiếp. Các kế hoạch chuyên nghiệp thêm bảo vệ mật khẩu và liên kết vĩnh viễn — hữu ích nếu nội dung MP3 của bạn đang chạy công việc khách hàng đang diễn ra.
STT.ai hỗ trợ tải lên URL từ hơn 1. 300 nền tảng (YouTube, Vimeo, SoundCloud, podcast host, v. v.). Nếu nguồn trả về MP3 hoặc bất cứ thứ gì có thể chuyển đổi thành MP3, chúng tôi có thể phiên dịch nó. Các nguồn được bảo vệ DRM không thể được phiên dịch; đối với những nguồn này, hãy tải xuống bằng tay và tải lên trực tiếp tập tin MP3.