Convert OGG to Text
بارگيري ogg 100 زبان، تشخیص سخنران، مهر زمان شامل میشه
در مورد OGG
OGG Vorbis is an open-source lossy audio format. Commonly used in web applications and voice messages.
صادرات رونوشت به عنوان
.TXT
متن ساده
.SRT
زیرنویس
.VTT
وبگاه
.DOCX
سند واژۀ
.JSON
ساختاری
.PDF
سند
پرسشهای متداول
Upload your OGG audio file (.ogg) to STT.ai or record live. Select your preferred AI model and click Transcribe — most files complete in under 5 minutes. Output formats include TXT, SRT, VTT, DOCX, JSON, and PDF.
بله. STT.ai به هر بازدید کننده 600 دقیقه رایگان در ماه برای رونوشت OGG می دهد. برای اولین پرونده شما نیازی به ثبت نام نیست. برنامه های پرداختی که از 5 دلار در ماه شروع می شوند پرونده های طولانی تر، دقیقه های بیشتر و رونوشت های خصوصی را قفل می کنند.
۸۸۰۰۰ یک فرمت فشرده با از دست دادن است، بنابراین فایلهای با نرخ بیت بسیار پایین (کمتر از ۶۴ کیلوبایت در ثانیه) میتواند در مقایسه با WAV یا FLAC بدون از دست دادن چند درصد دقت داشته باشد.
For most OGG files, STT.ai Enhanced or Whisper Large V3 give the best accuracy. NVIDIA Canary is faster with comparable quality on shorter clips. You can compare results from multiple models on the same file in the compare-stt tool.
بله. رونوشت صوتی ۸۸۰۰۰ از بیش از ۱۰۰ زبان پشتیبانی میکند. تشخیص خودکار برای بیشتر کلیپها کار میکند ، یا میتوانید زبان منبع را برای افزایش دقت به صورت دستی مشخص کنید.
بله. فهرستبندی بلندگوها بر روی هر قالب پشتیبانیشده ، از جمله ۸۸۰۰۰ ، کار میکند. هر بلندگو برچسبگذاری میشود) بلندگو ۱ ، بلندگو ۲ ،... ( و میتوانید بعداً آنها را در ویرایشگر تغییر نام دهید.
کاربران رایگان تا یک ساعت برای هر فایل دریافت میکنند؛ برنامههای پرداختی این را به ۸+ ساعت گسترش میدهند، که بیشتر پادکستهای طولانی و سخنرانیها را پوشش میدهد.
بله. ۸۸۰۰۰ پرونده به صورت پیشفرض پردازش و حذف میشوند. برنامههای حرفهای رمزگذاری سمت کارگزار را اضافه میکنند — حتی اگر پایگاه داده ما نقض شود، رونوشتهای شما بدون کلید شما قابل خواندن نیستند. دادهها هرگز بدون انتخاب صریح برای آموزش مدل استفاده نمیشوند.
بله. API REST مستقیماً از طریق نقطه پایانی /v1/transcribe ۸۸۰۰۰ فایل را میپذیرد. Python و Node.js SDK شامل ۸۸۰۰۰ مثال هستند.
بله. بعد از رونویسی یک پرونده ۸۸۰۰۰ میتوانید نتیجه را به عنوان زیرنویس SRT یا VTT صادر کنید — اگر برنامهریزی میکنید که بعداً صدا را با ویدئو جفت کنید یا برای دسترسی به صفحات پادکست تنها صدا مفید است.
بله. هر رونوشت در ویرایشگر داخلی ما باز می شود جایی که می توانید کلمات را تصحیح کنید، نام گویندگان را تغییر دهید، مهرهای زمانی را تنظیم کنید و یادداشت ها را اضافه کنید. ویرایش ها در صادرات باقی می مانند.
هر رونوشت یک نشانی وب مشترک منحصربهفرد دریافت میکند. صادرات به DOCX یا PDF برای ایمیل، یا پیوند را مستقیماً به اشتراک بگذارید. برنامههای حرفهای محافظت از گذرواژه و پیوندهای دائمی را اضافه میکنند — اگر محتوای ۸۸۰۰۰ شما کار مشتري را در حال اجرا هدایت کند ، مفید است.
STT.ai از آپلود نشانیهای وب از بیش از ۱۳۰۰ پلتفرم (Youtube، Vimeo، SoundCloud، میزبانهای پادکست و غیره) پشتیبانی میکند. اگر منبع OGG یا هر چیزی که قابل تبدیل به OGG باشد را برگرداند، میتوانیم آن را رونوشت کنیم. منابع محافظت شده با DRM نمیتوانند رونوشت شوند؛ برای آنها، به صورت دستی دانلود کرده و پرونده OGG را مستقیماً آپلود کنید.