Free Audio to Text Online مشارکت‌کنندگان ویکی‌پدیا.

تبدیل صدا به متن با رونویسی هوش مصنوعی. پرونده‌های صوتی را بارگذاری کنید، از میکروفون خود ضبط کنید، یا یک نشانی وب را بچسبانید. بیش از ۱۰۰ زبان، ۱۰ مدل، دقت ۹۸٪+.

با صوت و ویدئوهای در دسترس عمومی کار می‌کند. محتوای محافظت شده با DRM پشتیبانی نمی‌شود.

ارتقا برای بهبودیافته
Private transcript
گپ زدن با رونوشت
باز کردن قفل با Pro →
پروندۀ را اینجا بگذارید یا برای مرور کلیک کنید
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — تا ۲ گیگابایت
ارتقا برای بهبودیافته
Private transcript
گپ زدن با رونوشت
باز کردن قفل با Pro →
ارتقا برای بهبودیافته
ضبط: 0:00
زمان واقعی موم (موقت)
بهبودیافته زمزمه (دقت)
وبگاه رسمی 24hours.com · ثبت نام برای 7d + صدا · حرفه اي برای پیوندهای خصوصی

گفتار به متن در زمان واقعی. هوش مصنوعی خودکاراً در حین صحبت کردن شما را اصلاح می‌کند - دقت با صحبت طولانی تر بهبود می‌یابد.

ابتدا میکروفون خود را امتحان کنید
❤️ دوست STT.ai رو به دوستانت بگو
تو از رونوشت هاي مجانيت استفاده کردي

برای دریافت ۶۰۰ دقیقه/ماه رایگان ثبت نام کنید یا برای رونوشت‌های نامحدود ارتقاء پیدا کنید.

۱۰ دقیقه آزاد در روز 600 دقیقه رایگان با ثبت نام کارت اعتباري ندارم رمزگذاری شده
ثبت نام مجانی →

بارگذاری صوتی

بارگذاری MP3, WAV, M4A, FLAC, OGG, یا هر قالب صوتی. تا ۲ گیگابایت.

2. AI Processes Audio

هوش مصنوعی با تشخیص گوینده و نشان زمان، گفتار را از صدای شما استخراج می‌کند.

3. رونوشت رو بگير

نمایش، ویرایش، بارگیری یا اشتراک‌گذاری. صادرات به عنوان TXT، SRT، VTT، DOCX یا PDF.

قالبهای صوتی پشتیبانی‌شده

مدل‌های صوت به متن

مدل هوش مصنوعی را که با نیازهای شما سازگار است انتخاب کنید یا اجازه دهید ما بهترین را انتخاب کنیم.

رونوشت صدا در بیش از ۱۰۰ زبان

استفاده از موارد صوت به متن

آماده تبدیل صدا به متن هستید؟

شروع آزاد →

پرسشهای متداول

Upload your audio file or paste a URL, pick an AI model, and click Transcribe. STT.ai returns editable text with timestamps and speaker labels — most files finish in under five minutes.

MP3, WAV, M4A, FLAC, OGG, AAC, AMR, and 10+ more are all supported. You don't need to convert between formats first — upload whatever your recorder or app produces.

A little. Lossless formats like WAV and FLAC carry bit-perfect audio, so accuracy is bounded only by the model and speaker clarity. Lossy formats (MP3, M4A) at 128 kbps or higher are effectively identical; very low bitrates under 64 kbps can cost a few points.

Yes. STT.ai includes 600 free minutes per month with no signup for your first file. Paid plans starting at $5/month add longer files, private transcripts, and priority processing.

On clean audio our best models reach 95-97% accuracy (3-5% Word Error Rate). Background noise, overlapping speakers, and strong accents are the main factors that lower accuracy.

Yes. Free users can transcribe up to one hour per file; paid plans extend that to 8+ hours, which covers full-length podcasts, interviews, and audiobooks in a single pass.

Yes. Speaker diarization labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the editor — works on every supported audio format and model.

Export to TXT, DOCX, PDF, JSON, or SRT/VTT subtitles. JSON keeps machine-readable timestamps and speaker labels; DOCX and PDF are best for sharing and archiving.

Yes. 100+ languages with auto-detection, plus the option to set the language manually. Mixed-language audio is handled by switching mid-file, and you can translate the result afterwards.

Yes. Audio is processed and deleted by default, and Pro plans add client-side encryption so transcripts are unreadable without your key. Nothing is used for training without explicit opt-in.

Yes. Paste a link from any of 1,300+ supported platforms — podcast hosts, SoundCloud, YouTube, and more — and STT.ai fetches the audio directly. DRM-protected sources can't be transcribed.

Yes. The REST API accepts audio files directly, with Python and Node.js SDKs and a free tier of 100 minutes/month. Per-second billing applies beyond the free tier.