گزارش اشکال / درخواست ویژگی

انگلیسی تبدیل گفتار به متنComment

تبدیل انگلیسی (English) صدا به متن با تشخیص گفتار هوش مصنوعی پیشرفته. سریع، دقیق و پشتیبانی از قالب‌های چند صدا و ویدئو.

با صوت و ویدئوهای در دسترس عمومی کار می‌کند. محتوای محافظت شده با DRM پشتیبانی نمی‌شود.

ارتقا برای بهبودیافته

رونوشت خصوصی

گپ زدن با رونوشت

باز کردن قفل با Pro →

پروندۀ را اینجا بگذارید یا برای مرور کلیک کنید

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — تا ۲ گیگابایت

بارگذاری چند پروندۀ دسته با پرو

ارتقا برای بهبودیافته

رونوشت خصوصی

گپ زدن با رونوشت

باز کردن قفل با Pro →

ارتقا برای بهبودیافته

گفتار به متن در زمان واقعی. هوش مصنوعی خودکاراً در حین صحبت کردن شما را اصلاح می‌کند - دقت با صحبت طولانی تر بهبود می‌یابد.

ابتدا میکروفون خود را امتحان کنید

۱۰ دقیقه آزاد در روز 600 دقیقه رایگان با ثبت نام کارت اعتباري ندارم رمزگذاری شده

ثبت نام مجانی →

بهترین مدل‌ها برای انگلیسی

مدل	ارائه‌دهنده	WER
STT.ai Enhanced بهترین	STT.ai	3.2%	امتحان کن
Whisper Large V3	OpenAI	4.2%	امتحان کن
Whisper Turbo	OpenAI	5.1%	امتحان کن
NVIDIA Canary	NVIDIA	3.5%	امتحان کن
Moonshine	Useful Sensors	7.8%	امتحان کن
NVIDIA Parakeet	NVIDIA	3.0%	امتحان کن
SenseVoice	FunAudioLLM	5.5%	امتحان کن
Distil-Whisper	Hugging Face	5.8%	امتحان کن
Vosk	Alpha Cephei	12.0%	امتحان کن

در مورد انگلیسی رونوشت

English is the most widely spoken language globally and the dominant language for business, technology, and international communication. STT.ai provides industry-leading English speech recognition across all major accents including American, British, Australian, and Indian English.

STT.ai يه جورايي پيشرفته هست انگلیسی چه شما نیاز به رونوشت مصاحبه، سخنرانی، پادکست، یا جلسه در زبان انگلیسی داشته باشید، انگلیسیپلتفرم ما به طور خودکار زبان رو تشخیص میده و بهترین مدل رو برای بهترین دقت انتخاب میکنه

چقدر دقیق است انگلیسی رونوشت؟

دقت برای انگلیسی رونوشت به کیفیت صدا، شفافیت بلندگو، نویز پس زمینه و مدلی که انتخاب می‌کنید بستگی دارد. در صدای تمیز با یک بلندگو، بهترین مدل‌های ما به نرخ خطای کلمه (WER) کمتر از ۶٪ برای انگلیسی -در حال نزديک شدن به دقت سطح انسان.

براي بهترين نتيجه با انگلیسی صدا، ما توصیه می کنیم:

پاک کردن صدا -- به حداقل رساندن نویز پس زمینه و استفاده از میکروفون خوب
بخشهای بلندگوهای تک -- فعال‌سازی نوشتار بلندگو برای ضبط چند بلندگو
مدل درست رو انتخاب کن -- NVIDIA Canary پایین‌ترین WER را برای زبان‌های پشتیبانی شده ارائه می‌دهد، در حالی که Whisper Large V3 گسترده‌ترین پوشش زبان را ارائه می‌دهد
مشخص کردن زبان -- در حالی که تشخیص خودکار خوب کار می‌کند ، انتخاب دستی انگلیسی می تواند دقت را کمی بهبود بخشد

قالبهای صادرات برای انگلیسی رونوشت

بعد از اينکه رونوشت رو نوشتم انگلیسی صوت، نتیجه را در یکی از این قالب‌ها بارگیری کنید:

TXT

رونوشت متن ساده

SRT

زیرنویس با مهر زمان

VTT

زیرنویس ویدئوهای وب

DOCX

سند Word

JSON

داده‌های ساختاری با مهرهای زمانی

PDF

سند آماده چاپ

پرسشهای متداول

Upload an audio or video file containing انگلیسی (English) to STT.ai or paste a URL. Select a model that supports انگلیسی — for best results pick the one with the lowest WER on the table above — and click Transcribe.

Yes. STT.ai gives every visitor 600 free minutes/month, which includes انگلیسی (1.5 billion speakers worldwide). No signup required for your first file. Paid plans starting at $5/month unlock longer files and private transcripts.

دقت ۸۸۰۰۰ در صدای تمیز با بهترین مدلهای ما به ۹۳- ۹۶٪ می‌رسد. اعداد، اسامی خاص و اشکال خمیده همگی مدیریت می‌شوند. صدای تمیز با کمترین نویز پس زمینه بهترین نتایج را تولید می‌کند.

Whisper Large V3 دارای پوشش گسترده‌ترین انگلیسی است؛ NVIDIA Canary دارای پوشش کمترین WER در انواع پشتیبانی شده انگلیسی است؛ STT.ai Enhanced هر دو را برای برنامه‌های پرداختی متحد می‌کند.

بله. خروجی ۸۸۰۰۰ شامل نشانه گذاری) نقطه ، کمان ، علامت سؤال (و تنظیم مناسب است. اعداد و عنوانها از قواعد ۸۸۰۰۰ پیروی می‌کنند. ویرایشگر رونوشت به شما اجازه می‌دهد که نشانه گذاری را دستی تنظیم کنید.

بله. نوشتارگویی زبان‌ناشناس است و در ۸۸۰۰۰ به همان شکلی که در انگلیسی کار می‌کند ، کار می‌کند. هر گوینده برچسب‌گذاری می‌شود) گوینده ۱ ، گوینده ۲ ،... (و می‌توانید بعد از رونوشت ، آنها را در ویرایشگر تغییر نام دهید.

یک فایل صوتی یک ساعته ۸۸۰۰۰ معمولاً ۲ تا ۳ دقیقه با سریعترین مدل‌های ما و کمی بیشتر با مدل‌های با دقت بالا طول می‌کشد.

۸۸۰۰۰ فایل در MP3، WAV، M4A، FLAC، OGG، MP4، MKV، MOV، WebM، AVI و ۱۰+ فرمت دیگر همه کار می‌کنند. خروجی به TXT، SRT، VTT، DOCX، JSON و PDF - همه با ۸۸۰۰۰ متن سالم.

بله. ۸۸۰۰۰ پرونده صوتی به صورت پیش‌فرض پردازش و حذف می‌شوند. برنامه‌های حرفه‌ای رمزگذاری سمت کارگزار را اضافه می‌کنند — حتی اگر پایگاه داده ما نقض شود، رونوشت‌های شما بدون کلید شما قابل خواندن نیستند. داده‌های ۸۸۰۰۰ هیچ‌گاه بدون انتخاب صریح برای آموزش مدل استفاده نمی‌شود.

بله. رونوشت را به صورت SRT یا VTT صادر کنید — هر دو با یوتیوب، ویمو، تیک تاک و تمام پلتفرم‌های ویدئویی اصلی کار می‌کنند. ابزار زیرنویس سوزاندن آن‌ها را به عنوان زیرنویس سخت بر روی ویدئو قرار می‌دهد.

بله. بعد از رونوشت ۸۸۰۰۰، ابزار ترجمه زیرنویس می‌تواند SRT/VTT را به هر یک از ۱۰۰ زبان هدف ترجمه کند. اگر محتوای ۸۸۰۰۰ شما به زیرنویس برای مخاطبان گسترده‌تر نیاز داشته باشد، مفید است.

بله. API REST از طریق پارامتر زبان از انگلیسی پشتیبانی می‌کند (خودکاریابی نیز در دسترس است). SDKهای پایتون و Node.js به شما اجازه می‌دهد که صوت انگلیسی را با مهرهای زمانی کامل و برچسب‌های بلندگو به صورت دسته ای رونویسی کنید.

برای ۸۸۰۰۰، بزرگترین متغیرهای دقت، نویز پس زمینه، بلندگوهای همپوشانی، و شدت لهجه هستند. از یک میکروفون خوب استفاده کنید، هر زمان که ممکن است بلندگوهای جداگانه را استفاده کنید، و یک مدل آموزش دیده در لهجه مربوطه را انتخاب کنید.

انگلیسی تبدیل گفتار به متنComment

بهترین مدل‌ها برای انگلیسی

در مورد انگلیسی رونوشت

چقدر دقیق است انگلیسی رونوشت؟

قالبهای صادرات برای انگلیسی رونوشت

پرسشهای متداول

چطوري انگلیسی صدا رو به متن تبديل کنم؟

انگلیسی رونوشت رایگانه؟

انگلیسی چقدر دقيقه؟

چه مدل هوش مصنوعی برای انگلیسی بهتر است؟

ميشه يه علامت و يه زيرنویس براي انگلیسی بدي؟

انگلیسی صدا رو هم ميشه يه جورايي يه جورايي يه جورايي يه جورايي

انگلیسی رونوشت چقدر طول ميکشه؟

این کتابخانه شامل ۸۸۰۰۰ فایل است.

داده هاي صوتي انگلیسی من خصوصيه؟

مي تونم انگلیسی عنوان و زيرنویس توليد کنم؟

مي تونم انگلیسی نسخه رو به زبان هاي ديگه ترجمه کنم؟

میتونم از API انگلیسی استفاده کنم؟

در این دهستان ۸۸۸ نفر زندگی می‌کنند.