Lapor Pepijat / Permintaan Ciri

_Trenskripsikan dengan STT.ai Enhanced

Name: STT.ai Enhanced
Author: STT.ai

Berfungsi dengan audio & video yang tersedia untuk umum. Kandungan yang dilindungi DRM tidak disokong.

Naik taraf untuk Dipertingkatkan

Transkripsi Peribadi

Berbual dengan transkripsi

Buka dengan Pro →

Letakkan fail di sini atau klik untuk layari

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — sehingga 2GB

Muat naik fail berbilang secara berkelompok dengan Pro

Naik taraf untuk Dipertingkatkan

Transkripsi Peribadi

Berbual dengan transkripsi

Buka dengan Pro →

Naik taraf untuk Dipertingkatkan

Percakapan masa nyata ke teks. AI auto-betulkan bila anda bercakap — ketepatan bertambah dengan percakapan yang lebih panjang.

Uji mikrofon anda dahulu

10 minit percuma/hari 600 min percuma dengan mendaftar Tiada kad kredit Disulitkan

Daftar masuk percuma →

3.2%

WER

100

Bahasa

160.0x

Kelajuan

Proprietary

Lesen

Tentang STT.ai Enhanced

STT.ai Enhanced adalah model ucapan-ke-teks kami yang paling tepat dan pantas. Dibina pada arsitektur transformator terkini dengan pengoptimuman hak milik, ia memberikan kadar ralat perkataan terkemuka dalam industri melebihi 100+ bahasa. Ideal untuk transkripsi pengeluaran, subtitel masa nyata, dan aplikasi perniagaan.

Bahasa yang disokong oleh STT.ai Enhanced

Inggeris

Sepanyol

Perancis

Jerman

Cina

Jepun

Korea

Portugis

Arab

Hindi

Rusia

Itali

Belanda

Turki

Poland

Sweden

Indonesia

Thai

Vietnam

Czech

Greek

Romania

Hungary

Ibrani

Denmark

Finland

Norway

Ukraine

Bahasa Malaysia

Benggali

✦ Nyahkunci Model Diperbaiki

Dapatkan akses kepada model kami yang paling tepat dengan sebarang rancangan berbayar. 3.2% WER, 160x kelajuan masa nyata, 100+ bahasa.

Papar Rencana →

atau daftar percuma

Maklumat Model

PenyediaSTT.ai
Arkitektur-
LesenProprietary
DikemaskiniMar 2026

Model berkaitan

4.2% WER

5.1% WER

3.5% WER

7.8% WER

3.0% WER

Soalan Lazim

STT.ai Enhanced adalah model pertuturan-ke-teks oleh STT.ai. STT.ai memuatkan STT.ai Enhanced pada infrastruktur GPU kami supaya anda boleh menggunakannya tanpa menyediakan perkakasan anda sendiri — muat naik audio atau video dan pilih STT.ai Enhanced dari pemilih model.

Pada piawaian piawai, STT.ai Enhanced mencapai kira-kira 3.2% Kadar Ralat Perkataan. Ketepatan dunia nyata bergantung pada kualiti audio, loghat, dan bahasa; untuk rakaman bising atau loghat, harapkan beberapa peratusan WER yang lebih tinggi.

STT.ai Enhanced adalah model premium — dimasukkan dengan mana-mana rancangan STT.ai berbayar bermula pada $5/bulan. Pengguna percuma boleh pralihat STT.ai Enhanced pada klip pendek; fail yang lebih panjang memerlukan rancangan aktif.

STT.ai Enhanced disalurkan di bawah Proprietary. Versi dihost STT.ai mengendalikan keserasian lesen untuk anda jadi penggunaan komersial melalui perkhidmatan kami adalah mudah.

STT.ai Enhanced menyokong 100 bahasa. Auto-kesan memilih bahasa yang betul untuk kebanyakan audio; anda juga boleh nyatakannya secara manual untuk ketelusan yang lebih baik.

STT.ai Enhanced memproses audio pada kira-kira 160.0x masa nyata pada GPU kami. Fail audio 1 jam selesai dalam kurang daripada 1 minit; fail yang lebih panjang berijil dan maklumkan melalui emel bila selesai.

STT.ai Enhanced mempunyai parameter 1.5B. Model yang lebih besar cenderung lebih tepat tetapi lebih perlahan; STT.ai memuatkan STT.ai Enhanced pada GPU jadi kiraan parameter tidak mempengaruhi prestasi sisi klien anda.

STT.ai Enhanced menerima setiap format yang disokong STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, dan lain-lain. Output sebagai TXT, SRT, VTT, DOCX, JSON, atau PDF.

Ya. Diarisasi pembicara berjalan bersama STT.ai Enhanced untuk setiap transkripsi — setiap pembicara dilabel dan anda boleh menamakan semula mereka dalam editor selepas itu.

Ya. STT.ai Enhanced berjalan dalam infrastruktur persendirian kami — audio diproses dan dipadam secara lalai. Pro+ menambah penyulitan sisi klien supaya transkripsi tidak boleh dibaca tanpa kunci anda, dan Awan Persendirian membolehkan anda menghost STT.ai Enhanced sepenuhnya dalam VPC anda sendiri.

Gunakan alat compare-stt untuk jalankan STT.ai Enhanced terhadap model yang disokong lain pada audio yang sama — anda akan lihat WER, kiraan segmen, label pengeras, dan skor keyakinan berdampingan. Perbandingan STT.ai Enhanced vs Whisper Large V3 adalah yang paling biasa dijalankan.

Ya. Nyatakan "stt-ai-enhanced" sebagai parameter model pada titik akhir /v1/transcribe. Python dan Node.js SDKs termasuk contoh STT.ai Enhanced. Tahap API percuma termasuk 100 minit/bulan.

Lisensi untuk STT.ai Enhanced ditetapkan oleh STT.ai; penghijrahan-sendiri bergantung pada terma mereka. Servis dihost STT.ai menjalankan STT.ai Enhanced pada GPU yang dikendalikan jadi anda tidak perlu mengendalikan integrasi itu.

_Trenskripsikan dengan STT.ai Enhanced

Tentang STT.ai Enhanced

Bahasa yang disokong oleh STT.ai Enhanced

✦ Nyahkunci Model Diperbaiki

Maklumat Model

Model berkaitan

Soalan Lazim

Apa itu STT.ai Enhanced?

Berapa tepatnya STT.ai Enhanced?

Adakah STT.ai Enhanced percuma untuk digunakan?

Lesen apa yang STT.ai Enhanced gunakan?

Berapa banyak bahasa yang disokong STT.ai Enhanced?

Seberapa cepat STT.ai Enhanced?

Berapa besar model STT.ai Enhanced?

Format audio apa yang boleh STT.ai Enhanced transkripsi?

Adakah STT.ai Enhanced mengesan beberapa pembesar suara?

Adakah data saya peribadi apabila menggunakan STT.ai Enhanced?

Bagaimana STT.ai Enhanced dibandingkan dengan model STT lain?

Bolehkah saya menggunakan STT.ai Enhanced melalui API?

Bolehkah saya menjalankan STT.ai Enhanced pada pelayan saya sendiri?