Transcribe with NVIDIA Parakeet

با صوت و ویدئوهای در دسترس عمومی کار می‌کند. محتوای محافظت شده با DRM پشتیبانی نمی‌شود.

ارتقا برای بهبودیافته
Private transcript
گپ زدن با رونوشت
باز کردن قفل با Pro →
پروندۀ را اینجا بگذارید یا برای مرور کلیک کنید
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — تا ۲ گیگابایت
ارتقا برای بهبودیافته
Private transcript
گپ زدن با رونوشت
باز کردن قفل با Pro →
ارتقا برای بهبودیافته
ضبط: 0:00
زمان واقعی موم (موقت)
بهبودیافته زمزمه (دقت)
وبگاه رسمی 24hours.com · ثبت نام برای 7d + صدا · حرفه اي برای پیوندهای خصوصی

گفتار به متن در زمان واقعی. هوش مصنوعی خودکاراً در حین صحبت کردن شما را اصلاح می‌کند - دقت با صحبت طولانی تر بهبود می‌یابد.

ابتدا میکروفون خود را امتحان کنید
❤️ دوست STT.ai رو به دوستانت بگو
تو از رونوشت هاي مجانيت استفاده کردي

برای دریافت ۶۰۰ دقیقه/ماه رایگان ثبت نام کنید یا برای رونوشت‌های نامحدود ارتقاء پیدا کنید.

۱۰ دقیقه آزاد در روز 600 دقیقه رایگان با ثبت نام کارت اعتباري ندارم رمزگذاری شده
ثبت نام مجانی →
3.0%
WER
1
Languages
55.0x
Speed
CC-BY-4.0
License

About NVIDIA Parakeet

Languages Supported by NVIDIA Parakeet

پرسشهای متداول

STT.ai میزبان NVIDIA Parakeet در زیرساخت GPU ماست بنابراین می‌توانید بدون فراهم کردن سخت‌افزار خود از آن استفاده کنید - صدا یا ویدئو را بارگذاری کنید و NVIDIA Parakeet را از گزینش مدل انتخاب کنید.

در استانداردهای استاندارد، ۸۸۰۰۰۰ در حدود ۸۸۰۰۰۱٪ نرخ خطای کلمه را بدست می‌آورد. دقت واقعی بستگی به کیفیت صدا، لهجه و زبان دارد؛ برای ضبط‌های پر سر و صدا یا لهجه، انتظار چند درصد بالاتر از WER را داشته باشید.

NVIDIA Parakeet در لایه رایگان STT.ai اجرا می‌شود - هر بازدیدکننده ۶۰۰ دقیقه / ماه بدون هزینه دریافت می‌کند.

شما می‌توانید ۸۸۰۰۰ را بر روی سخت‌افزار خود میزبانی کنید یا از نسخه میزبانی شده ما استفاده کنید - هر دو قابل استفاده تجاری هستند.

۸۸۰۰۰ از ۸۸۰۰۰۱ زبان پشتیبانی می‌کند. تشخیص خودکار زبان درست را برای بیشتر صداها انتخاب می‌کند؛ همچنین می‌توانید آن را برای یک بالا بردن دقت کوچک به صورت دستی مشخص کنید.

یک فایل صوتی یک ساعته در کمتر از ۸۸۰۰۰۲ دقیقه به پایان می‌رسد؛ فایل‌های طولانی‌تر در صف قرار می‌گیرند و هنگام انجام شدن توسط ایمیل اطلاع داده می‌شوند.

NVIDIA Parakeet has 1.1B parameters. Larger models tend to be more accurate but slower; STT.ai hosts NVIDIA Parakeet on GPU so the parameter count doesn't affect your client-side performance.

NVIDIA Parakeet هر فرمتی را که STT.ai پشتیبانی می‌کند را می‌پذیرد - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI و دیگران.

بله. نوشتار شنونده در کنار NVIDIA Parakeet برای هر رونوشت اجرا می شود — هر شنونده برچسب گذاری شده و می توانید بعداً آنها را در ویرایشگر تغییر نام دهید.

بله. ۸۸۰۰۰ در محیط مدیریت شده ما اجرا می‌شود — صدا به صورت پیش‌فرض پردازش و حذف می‌شود و هیچ‌گاه برای آموزش بدون انتخاب صریح استفاده نمی‌شود.

از ابزار compare-stt برای اجرا کردن ۸۸۰۰۰ در مقابل هر مدل پشتیبانی شده دیگری در همان صدا استفاده کنید - شما WER، شمار بخش‌ها، برچسب‌های بلندگو و امتیازات اعتماد را در کنار هم خواهید دید.

بله. "nvidia-parakeet" را به عنوان پارامتر مدل در /v1/transcribe endpoint مشخص کنید. Python و Node.js SDK شامل نمونه‌های NVIDIA Parakeet هستند. سطح API رایگان شامل ۱۰۰ دقیقه در ماه است.

بله. چون NVIDIA Parakeet دارای مجوز CC-BY-4.0 است، شما می‌توانید آن را خودتان میزبانی کنید. صفحهٔ منبع باز STT.ai فهرستی از پروژه و وزن‌ها را ارائه می‌دهد. بیشتر تیم‌های تولید از نسخهٔ میزبانی شده ما برای فراموش کردن خرید GPU، مبادلات مدل و عملیات استفاده می‌کنند.