Báo cáo lỗi / yêu cầu tính năng

Bản dịch bằng SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Làm việc với âm thanh và video công cộng. Không hỗ trợ nội dung được bảo vệ DRM.

Tăng cấp cho nâng cấp

Bản dịch riêng

Trò chuyện với bản ghi chép

Mở khóa với Pro →

Thả tập tin vào đây hoặc nhấn để duyệt

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — lên đến 2GB

Tải lên nhiều tập tin một lúc với Pro

Tăng cấp cho nâng cấp

Bản dịch riêng

Trò chuyện với bản ghi chép

Mở khóa với Pro →

Tăng cấp cho nâng cấp

Tự động sửa lỗi khi bạn nói — độ chính xác tăng lên khi nói lâu hơn.

Kiểm tra micro đầu tiên

10 phút miễn phí/ngày 600 phút miễn phí với đăng ký Không có thẻ tín dụng Đã mã hóa

Đăng ký miễn phí →

5.5%

WER

Ngôn ngữ

50.0x

Tốc độ

MIT

Giấy phép

Về SenseVoice

SenseVoice là một mô hình cơ sở nói từ FunAudioLLM vượt quá phiên âm. Nó hỗ trợ hơn 50 ngôn ngữ và bao gồm khả năng nhận dạng cảm xúc, phát hiện sự kiện âm thanh, và bình thường hóa văn bản ngược trong một mô hình duy nhất.

Ngôn ngữ được hỗ trợ SenseVoice

Tiếng Anh

Tiếng Tây Ban Nha

Tiếng Pháp

Tiếng Đức

Tiếng Trung

Tiếng Nhật

Tiếng Hàn

Tiếng Bồ Đào Nha

Tiếng Ả Rập

Tiếng Hindi

Tiếng Nga

Tiếng Italy

Tiếng Hà Lan

Tiếng Thổ Nhĩ Kỳ

Tiếng Ba Lan

Tiếng Thụy Điển

Tiếng Indonesia

Tiếng Thái

Tiếng Việt

Tiếng Séc

Tiếng Hy Lạp

Tiếng Romania

Tiếng Hungary

Tiếng Do Thái

Tiếng Đan Mạch

Tiếng Phần Lan

Tiếng Na Uy

Tiếng Ukraina

Tiếng Mã Lai

Tiếng Bangla

Thông tin mẫu

Nhà cung cấpFunAudioLLM
Kiến trúc-
Giấy phépMIT
Cập nhậtMar 2026

Mô hình liên quan

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Câu hỏi thường gặp

STT.ai host SenseVoice on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick SenseVoice from the model picker.

Độ chính xác thực tế phụ thuộc vào chất lượng âm thanh, giọng nói và ngôn ngữ; đối với các bản ghi âm ồn ào hoặc có giọng nói, chờ đợi một vài điểm phần trăm cao hơn WER.

SenseVoice chạy trên tầng miễn phí của STT.ai - mỗi khách truy cập có 600 phút để bắt đầu miễn phí. Các kế hoạch trả phí thêm giới hạn dài hơn cho mỗi tập tin, bản ghi riêng tư, và xếp hàng ưu tiên.

SenseVoice được phát hành dưới giấy phép mã nguồn mở MIT. Bạn có thể tự lưu trữ SenseVoice trên phần cứng của mình hoặc sử dụng phiên bản lưu trữ của chúng tôi — cả hai đều có thể sử dụng thương mại.

SenseVoice hỗ trợ 50 ngôn ngữ. Tự động phát hiện chọn ngôn ngữ đúng cho hầu hết âm thanh; bạn cũng có thể chỉ định nó bằng tay để tăng độ chính xác một chút.

SenseVoice xử lý âm thanh với tốc độ khoảng 50.0x thời gian thực trên GPU của chúng tôi. Một tập tin âm thanh 1 giờ hoàn thành trong 1 phút; tập tin dài hơn xếp hàng và thông báo bằng email khi hoàn thành.

SenseVoice có các tham số 234M. Các mẫu lớn có xu hướng chính xác hơn nhưng chậm hơn; STT.ai host SenseVoice trên GPU vì vậy số lượng tham số không ảnh hưởng đến hiệu suất bên máy khách.

SenseVoice chấp nhận mọi định dạng STT.ai hỗ trợ — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, và những thứ khác.

Vâng. Tính toán các người nói chạy cùng với SenseVoice cho mỗi bản phiên âm — mỗi người nói được đánh dấu và bạn có thể đổi tên chúng trong trình biên tập sau đó.

Có. SenseVoice chạy trong môi trường quản lý của chúng tôi — âm thanh được xử lý và xóa theo mặc định và không bao giờ được sử dụng cho huấn luyện mà không có sự đồng ý rõ ràng. Các kế hoạch Pro thêm mã hóa bên khách hàng cho các bản ghi khi nghỉ.

Dùng công cụ compare-stt để chạy SenseVoice so với bất kỳ mô hình nào được hỗ trợ trên cùng một âm thanh — bạn sẽ thấy WER, số phân đoạn, nhãn loa, và điểm tin cậy cạnh nhau.

Có. Chỉ ra "sensevoice" như tham số mô hình trên điểm kết thúc /v1/transcribe. Python và Node.js SDK bao gồm ví dụ SenseVoice. Lớp API miễn phí bao gồm 100 phút/tháng.

Vâng. Bởi vì SenseVoice được cấp phép MIT, bạn có thể tự lưu trữ nó. Trang mã nguồn mở của STT.ai liệt kê dự án và trọng lượng. Hầu hết các nhóm sản xuất sử dụng phiên bản lưu trữ của chúng tôi để bỏ qua việc mua GPU, thay đổi mô hình và các hoạt động.

Bản dịch bằng SenseVoice

Về SenseVoice

Ngôn ngữ được hỗ trợ SenseVoice

Thông tin mẫu

Mô hình liên quan

Câu hỏi thường gặp

SenseVoice là gì?

SenseVoice chính xác đến đâu?

SenseVoice có miễn phí không?

SenseVoice dùng giấy phép gì?

SenseVoice hỗ trợ bao nhiêu ngôn ngữ?

SenseVoice nhanh thế nào?

Kiểu SenseVoice to cỡ nào?

SenseVoice có thể chuyển đổi định dạng âm thanh nào?

SenseVoice có phát hiện nhiều loa không?

Dữ liệu của tôi có riêng tư khi sử dụng SenseVoice không?

SenseVoice so sánh với các mẫu STT khác như thế nào?

Tôi có thể dùng SenseVoice qua API không?

Tôi có thể chạy SenseVoice trên máy chủ của mình không?