Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
پرسشهای متداول
STT.ai میزبان SenseVoice در زیرساخت GPU ماست بنابراین میتوانید بدون فراهم کردن سختافزار خود از آن استفاده کنید - صدا یا ویدئو را بارگذاری کنید و SenseVoice را از گزینش مدل انتخاب کنید.
در استانداردهای استاندارد، ۸۸۰۰۰۰ در حدود ۸۸۰۰۰۱٪ نرخ خطای کلمه را بدست میآورد. دقت واقعی بستگی به کیفیت صدا، لهجه و زبان دارد؛ برای ضبطهای پر سر و صدا یا لهجه، انتظار چند درصد بالاتر از WER را داشته باشید.
SenseVoice در لایه رایگان STT.ai اجرا میشود - هر بازدیدکننده ۶۰۰ دقیقه / ماه بدون هزینه دریافت میکند.
شما میتوانید ۸۸۰۰۰ را بر روی سختافزار خود میزبانی کنید یا از نسخه میزبانی شده ما استفاده کنید - هر دو قابل استفاده تجاری هستند.
۸۸۰۰۰ از ۸۸۰۰۰۱ زبان پشتیبانی میکند. تشخیص خودکار زبان درست را برای بیشتر صداها انتخاب میکند؛ همچنین میتوانید آن را برای یک بالا بردن دقت کوچک به صورت دستی مشخص کنید.
یک فایل صوتی یک ساعته در کمتر از ۸۸۰۰۰۲ دقیقه به پایان میرسد؛ فایلهای طولانیتر در صف قرار میگیرند و هنگام انجام شدن توسط ایمیل اطلاع داده میشوند.
SenseVoice has 234M parameters. Larger models tend to be more accurate but slower; STT.ai hosts SenseVoice on GPU so the parameter count doesn't affect your client-side performance.
SenseVoice هر فرمتی را که STT.ai پشتیبانی میکند را میپذیرد - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI و دیگران.
بله. نوشتار شنونده در کنار SenseVoice برای هر رونوشت اجرا می شود — هر شنونده برچسب گذاری شده و می توانید بعداً آنها را در ویرایشگر تغییر نام دهید.
بله. ۸۸۰۰۰ در محیط مدیریت شده ما اجرا میشود — صدا به صورت پیشفرض پردازش و حذف میشود و هیچگاه برای آموزش بدون انتخاب صریح استفاده نمیشود.
از ابزار compare-stt برای اجرا کردن ۸۸۰۰۰ در مقابل هر مدل پشتیبانی شده دیگری در همان صدا استفاده کنید - شما WER، شمار بخشها، برچسبهای بلندگو و امتیازات اعتماد را در کنار هم خواهید دید.
بله. "sensevoice" را به عنوان پارامتر مدل در /v1/transcribe endpoint مشخص کنید. Python و Node.js SDK شامل نمونههای SenseVoice هستند. سطح API رایگان شامل ۱۰۰ دقیقه در ماه است.
بله. چون SenseVoice دارای مجوز MIT است، شما میتوانید آن را خودتان میزبانی کنید. صفحهٔ منبع باز STT.ai فهرستی از پروژه و وزنها را ارائه میدهد. بیشتر تیمهای تولید از نسخهٔ میزبانی شده ما برای فراموش کردن خرید GPU، مبادلات مدل و عملیات استفاده میکنند.