Convert WAV to Text
Envíe o seu wav ficheiro e obter unha transcrición precisa en segundos. Máis de 100 idiomas, detección de falantes, marcas de data e hora incluídas.
Acerca de %s WAV
WAV is an uncompressed audio format that preserves full audio quality. Ideal for high-accuracy transcription where file size is not a concern.
Exportar %s Transcricións Como
.TXT
Texto simple
.SRT
Subtítulos
.VTT
WebVTT
.DOCX
Documento de Word
.JSON
Estruturado
.PDF
Documento
Preguntas frecuentes
Envíe o seu ficheiro de son WAV (. wav) a STT.ai ou grave en directo. Escolla o seu modelo de IA preferido e prema en Transcrición — a maioría dos ficheiros recóllense en menos de 5 minutos. Os formatos de saída inclúen TXT, SRT, VTT, DOCX, JSON e PDF.
Si. STT.ai dá a cada visitante 600 minutos/ mes de transcrición WAV. Non é preciso rexistrarse para o primeiro ficheiro. Os plans de pago a partir de $5/ mes desbloquean ficheiros máis longos, máis minutos e transcricións privadas.
WAV é un formato sen perdas: o son que chega aos nosos modelos é bit- perfect, polo que a precisión só está limitada pola claridade do modelo e do altofalante, non polos artefactos do códec. Os nosos mellores modelos acadan unha precisión do 93- 97% cunha entrada WAV limpa.
Para a maioría dos ficheiros WAV, STT.ai Enhanced ou Whisper Large V3 dan a mellor precisión. NVIDIA Canary é máis rápido con calidade comparable en clips máis curtos. Pode comparar os resultados de varios modelos no mesmo ficheiro na ferramenta compare- stt.
Si. A transcrición de son WAV admite máis de 100 idiomas. A detección automática funciona para a maioría dos clips, ou pode especificar manualmente a lingua de orixe para mellorar un pouco a precisión.
Si. A diarización dos altofalantes funciona en todos os formatos soportados, incluíndo WAV. Cada altofalante está etiquetado (Altofalante 1, Altofalante 2,...) e pode mudarlles o nome no editor despois.
Soporta WAV ficheiros de son de ata 2 GB. Os usuarios gratuítos obteñen ata 1 hora por ficheiro; os plans de pago esténdense a máis de 8 horas, o que cobre a maioría dos podcasts e conferencias de formato longo.
Si. Procesan e borran por omisión WAV ficheiros. Os plans Pro engadirán cifrado do lado do cliente - mesmo se a nosa base de datos é violada, as súas transcricións son ilegibles sen a súa chave. Os datos nunca se empregan para adestramento de modelos sen a súa aceptación explícita.
Si. A API REST acepta WAV ficheiros directamente a través do endpoint / v1/ transcribe. Os SDK de Python e Node. js inclúen WAV exemplos. O nivel gratuíto inclúe 100 minutos/ mes de uso da API.
Si. Despois de transcreber un ficheiro WAV pode exportar o resultado como subtítulos SRT ou VTT, útil se planea emparellar o son co vídeo máis tarde, ou para accesibilidade en páxinas de podcasts só de son.
Si. Cada transcrición ábrese no editor incorporado onde pode corrixir palabras, mudar o nome dos oradores, axustar os selos de data e hora e engadir notas. As edicións persisten nas exportacións.
Cada transcrición obtén unha ligazón compartible. Como WAV é o formato sen perdas de calidade de estudio, as transcricións emparelladas son comúnmente usadas en fluxos de traballo de arquivo, emisión e forense; a exportación a PDF con marcas de data/ hora é un formato popular para estes.
STT.ai soporta envíos de URL desde máis de 1300 plataformas (YouTube, Vimeo, SoundCloud, servidores de podcasts, etc.). Se a fonte devolve WAV ou calquera cousa convertíbel a WAV, podemos transcribila. As fontes protexidas con DRM non se poden transcribir; para estas, descargue manualmente e envíe o ficheiro WAV directamente.