Convert WebM to Text
بارگيري webm 100 زبان، تشخیص سخنران، مهر زمان شامل میشه
در مورد WebM
WebM is an open web media format designed for HTML5 video. Common for web recordings and browser-based audio capture.
صادرات رونوشت به عنوان
.TXT
متن ساده
.SRT
زیرنویس
.VTT
وبگاه
.DOCX
سند واژۀ
.JSON
ساختاری
.PDF
سند
پرسشهای متداول
Upload your WebM video file (WEBM) to STT.ai or paste a URL — we extract the audio track automatically and run it through your chosen AI model. No manual demux step required. Output formats include TXT, SRT, VTT, DOCX, JSON, and PDF.
Yes. STT.ai includes 600 free minutes/month — enough for around 10 hours of video content. WebM files tend to be larger; upload limits scale with your plan. Paid plans start at $5/month.
دقت در رونویسی ویدئویی ۸۸۰۰۰ بستگی به آهنگ صوتی درون کانتینر دارد - بیتریت صوتی بالاتر (۲۵۶ kbps+) نتایج بهتری نسبت به آهنگهای صوتی بسیار فشرده شده میدهد. بهترین مدلهای ما به دقت ۹۳-۹۵٪ در دیالوگهای تمیز میرسند.
For most WebM files, STT.ai Enhanced or Whisper Large V3 give the best accuracy. NVIDIA Canary is faster with comparable quality on shorter clips. You can compare results from multiple models on the same file in the compare-stt tool.
بله. رونوشت ویدئویی ۸۸۰۰۰ از بیش از ۱۰۰ زبان پشتیبانی میکند و زبان گفتاری را به صورت خودکار تشخیص میدهد. برای گفتگوهای چندزبانه، تشخیص زبان را برای هر بخش فعال کنید.
بله. فهرستبندی بلندگوها بر روی هر قالب پشتیبانیشده ، از جمله ۸۸۰۰۰ ، کار میکند. هر بلندگو برچسبگذاری میشود) بلندگو ۱ ، بلندگو ۲ ،... ( و میتوانید بعداً آنها را در ویرایشگر تغییر نام دهید.
کاربران رایگان تا ۱ ساعت ویدئو در هر فایل دریافت میکنند؛ برنامههای پرداختی این را به ۸+ ساعت در هر فایل گسترش میدهند. برای فایلهای بزرگ دوربین خام، به H.264/AAC فشرده سازی کنید یا از یک URL بارگذاری استفاده کنید.
بله. ۸۸۰۰۰ پرونده به صورت پیشفرض پردازش و حذف میشوند. برنامههای حرفهای رمزگذاری سمت کارگزار را اضافه میکنند — حتی اگر پایگاه داده ما نقض شود، رونوشتهای شما بدون کلید شما قابل خواندن نیستند. دادهها هرگز بدون انتخاب صریح برای آموزش مدل استفاده نمیشوند.
بله. API REST مستقیماً از طریق نقطه پایانی /v1/transcribe ۸۸۰۰۰ فایل را میپذیرد. Python و Node.js SDK شامل ۸۸۰۰۰ مثال هستند.
بله — بعد از رونوشت میتوانید زیرنویسهای SRT یا VTT را صادر کنید ، و ابزار زیرنویسهای سوزاندن ما آنها را به عنوان زیرنویسهای سخت بر روی ویدئو ۸۸۰۰۰ شما قرار میدهد. ترکیب زیرنویس نرم برای قالبهای ۸۸۰۰۰ که دارای زیرنویسهای بومی هستند نیز پشتیبانی میشود (MKV ، MP4 با mov_text).
بله. هر رونوشت در ویرایشگر داخلی ما باز می شود جایی که می توانید کلمات را تصحیح کنید، نام گویندگان را تغییر دهید، مهرهای زمانی را تنظیم کنید و یادداشت ها را اضافه کنید. ویرایش ها در صادرات باقی می مانند.
صادرات رونوشت به عنوان SRT یا VTT ، سپس استفاده از ابزار زیرنویس سوزاندن ما برای نمایش زیرنویسهای سخت مستقیماً به ویدئو ۸۸۰۰۰ — بدون نیاز به دانش FFmpeg. برای زیرنویسهای نرم ، MKV و MP4 از پیوستن زیرنویسهای بدون کدگذاری مجدد پشتیبانی میکنند.
STT.ai از آپلود نشانیهای وب از بیش از ۱۳۰۰ پلتفرم (Youtube، Vimeo، SoundCloud، میزبانهای پادکست و غیره) پشتیبانی میکند. اگر منبع WebM یا هر چیزی که قابل تبدیل به WebM باشد را برگرداند، میتوانیم آن را رونوشت کنیم. منابع محافظت شده با DRM نمیتوانند رونوشت شوند؛ برای آنها، به صورت دستی دانلود کرده و پرونده WebM را مستقیماً آپلود کنید.