Free AI Fala a texto

Transcríbase audio e vídeo a texto en máis de 100 idiomas. Máis de 10 modelos de IA. Detección de falantes. Non é preciso rexistrarse.

4.1K
transcricións
109.7K
minutos transcritos
100+
linguas
70+
ferramentas libres

Funciona con son e vídeo dispoñíbeis publicamente. Non se admiten contidos protexidos con DRM.

Actualización para mellorado
Private transcript
Conversa con transcrición
Desbloquear con Pro →
Solte aquí o ficheiro ou prema para examinar
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ata 2 GB
Actualización para mellorado
Private transcript
Conversa con transcrición
Desbloquear con Pro →
Actualización para mellorado
Gravación: 0:00
En tempo real Cera (instantánea)
Mellorado Sussurrar (preciso)
Ligazóns públicas: 24h, só texto · Inscríbete para 7d + audio · Pro para ligazóns privadas

Fala a texto en tempo real. A IA corrixe automaticamente mentres fala — a precisión mellora coa duración da fala.

Probe primeiro o micrófono
❤️ Amas STT.ai?
Esgotou as súas transcricións libres.

Inscríbase de balde para obter 600 minutos/mes, ou actualícese para obter transcricións ilimitadas.

10 minutos libres/día 600 min gratis con rexistro Sen tarxeta de crédito Cifrado
Inscríbete gratis →
Almacenamento cifrado do lado do cliente — As súas transcricións están cifradas no seu navegador. Nin sequera nós podemos lelas. Aprenda como funciona →

Confiado por profesionais de todo o mundo

Como funciona o STT.ai

Tres pasos para unha transcrición precisa

1. Enviar, Gravar ou Apegar URL

Arrastre e solte calquera ficheiro de son ou vídeo (MP3, WAV, MP4 e máis de 20 formatos). Grave co micrófono en tempo real. Ou apegue unha ligazón de YouTube, Vimeo, TikTok e máis de 1300 plataformas.

2. A IA transcribe coa súa elección de modelo

Escolla entre máis de 10 modelos de IA, incluíndo Whisper, NVIDIA Canary (#1 en precisión) e Moonshine. Detecte automaticamente a linguaxe entre máis de 100 opcións. A diarización do falante identifica quen dixo que.

3. Exportar, compartir ou integrar

Obteña como TXT, SRT, VTT, DOCX, JSON ou PDF. Compartir mediante ligazón. Use a nosa API para integrar a transcrición no seu programa. Perfecto para subtítulos, notas de reunións, podcasts e máis.

100+
Linguas soportadas
70+
Ferramentas libres
1,300+
Plataformas soportadas
7
Formatos de exportación

API de desenvolvemento

Integre a voz a texto na súa aplicación en minutos. API RESTful con transmisión WebSocket en tempo real.

REST + WebSocket — Envio de ficheiros e transmisión en tempo real
Múltiplos modelos — Whisper, Canary, mellorado e máis
Diarización do falante — Detectar automaticamente quen dixo que
Saída flexible — JSON, TXT, SRT, VTT con marcas de tempo de palabra
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Listo para transcreber?

Envíe o seu primeiro ficheiro de balde. Sen tarxeta de crédito, sen rexistro. 600 minutos por mes no plan gratuíto.

Comezar a transcrición

Preguntas frecuentes

Envíe o seu ficheiro de son ou vídeo a STT.ai. Escolla o modelo e as opcións de IA que prefira e prema en Transcribir. A súa transcrición estará lista en minutos. Exporte como TXT, SRT, VTT, DOCX, JSON ou PDF.

Si! STT.ai ofrece 600 minutos gratuítos por mes para todos os usuarios. Non é preciso rexistrarse para a súa primeira transcrición. Os plans de pago con máis minutos e características comezan en $5/ mes.

A precisión depende do modelo de IA que escolla e da calidade do son. Os nosos mellores modelos acadan unha taxa de erro de palabra do 5- 7% nas probas, o que significa unha precisión do 93- 95%. Un son claro cun ruído de fondo mínimo produce os mellores resultados.

STT.ai ofrece máis de 10 modelos, incluíndo Whisper Large V3, NVIDIA Canary e outros. Pode comparar os resultados de diferentes modelos no mesmo ficheiro.

Si. Despois de transcreber, exporte a transcrición como ficheiros de subtítulos SRT ou VTT. Funcionan con YouTube, Vimeo e todas as plataformas de vídeo principais.

Si. O STT.ai identifica e etiqueta automaticamente diferentes altofalantes empregando a diarización de altofalantes da IA. Funciona en todos os modelos e linguaxes.

A maioría dos ficheiros transcríbense en menos de 5 minutos. Un ficheiro de son de 1 hora normalmente tarda 2- 3 minutos cos nosos modelos máis rápidos.

STT.ai soporta máis de 20 formatos de son e vídeo, incluíndo MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM e AVI. Exporta como TXT, SRT, VTT, DOCX, JSON ou PDF.

Si. Os ficheiros de son son procesados e eliminados despois da transcrición. Os seus datos nunca se empregan para adestramento. O cifrado do lado do cliente é gratuíto en todos os plans — cifra as transcricións almacenadas cunha chave que só ten vostede. Durante o procesamento, o servidor xestiona o seu son en texto plano. Aprenda sobre a nosa seguridade.

Si. STT.ai ofrece unha API REST con Python e Node. js SDKs. O nivel gratuíto inclúe 100 minutos/ mes.

Si. O STT.ai inclúe un editor de transcrición incorporado onde pode corrixir erros, mudar o nome dos oradores e axustar os selos de tempo.

Cada transcrición obtén unha ligazón única compartible. Exportar a DOCX ou PDF para enviar por correo electrónico. Os plans Pro ofrecen ligazóns permanentes e protexidas por contrasinal.

STT.ai soporta máis de 1300 plataformas, incluíndo YouTube, Vimeo, TikTok, SoundCloud e outras. A transcrición de URL só funciona con son e vídeo dispoñíbeis publicamente. O contido protexido por DRM (como episodios premium de Spotify, Netflix, Disney+, etc.) non se pode transcribir. Para o contido DRM, descargue o ficheiro por separado e envíeo directamente.