Convert OGG to Text
Envíe o seu ogg ficheiro e obter unha transcrición precisa en segundos. Máis de 100 idiomas, detección de falantes, marcas de data e hora incluídas.
Acerca de %s OGG
OGG Vorbis is an open-source lossy audio format. Commonly used in web applications and voice messages.
Exportar %s Transcricións Como
.TXT
Texto simple
.SRT
Subtítulos
.VTT
WebVTT
.DOCX
Documento de Word
.JSON
Estruturado
.PDF
Documento
Preguntas frecuentes
Envíe o seu ficheiro de son OGG (. ogg) a STT.ai ou grave en directo. Escolla o seu modelo de IA preferido e prema en Transcrición — a maioría dos ficheiros recóllense en menos de 5 minutos. Os formatos de saída inclúen TXT, SRT, VTT, DOCX, JSON e PDF.
Si. STT.ai dá a cada visitante 600 minutos/ mes de transcrición OGG. Non é preciso rexistrarse para o primeiro ficheiro. Os plans de pago a partir de $5/ mes desbloquean ficheiros máis longos, máis minutos e transcricións privadas.
OGG é un formato comprimido con perdas, polo que os ficheiros de taxa de bits moi baixa (menos de 64 kbps) poden custar uns poucos puntos porcentuais de precisión en comparación con WAV ou FLAC sen perdas. A 128 kbps ou máis, a diferenza é desprezable e os nosos mellores modelos acadan un 93- 95% de precisión.
Para a maioría dos ficheiros OGG, STT.ai Enhanced ou Whisper Large V3 dan a mellor precisión. NVIDIA Canary é máis rápido con calidade comparable en clips máis curtos. Pode comparar os resultados de varios modelos no mesmo ficheiro na ferramenta compare- stt.
Si. A transcrición de son OGG admite máis de 100 idiomas. A detección automática funciona para a maioría dos clips, ou pode especificar manualmente a lingua de orixe para mellorar un pouco a precisión.
Si. A diarización dos altofalantes funciona en todos os formatos soportados, incluíndo OGG. Cada altofalante está etiquetado (Altofalante 1, Altofalante 2,...) e pode mudarlles o nome no editor despois.
Soporta OGG ficheiros de son de ata 2 GB. Os usuarios gratuítos obteñen ata 1 hora por ficheiro; os plans de pago esténdense a máis de 8 horas, o que cobre a maioría dos podcasts e conferencias de formato longo.
Si. Procesan e borran por omisión OGG ficheiros. Os plans Pro engadirán cifrado do lado do cliente - mesmo se a nosa base de datos é violada, as súas transcricións son ilegibles sen a súa chave. Os datos nunca se empregan para adestramento de modelos sen a súa aceptación explícita.
Si. A API REST acepta OGG ficheiros directamente a través do endpoint / v1/ transcribe. Os SDK de Python e Node. js inclúen OGG exemplos. O nivel gratuíto inclúe 100 minutos/ mes de uso da API.
Si. Despois de transcreber un ficheiro OGG pode exportar o resultado como subtítulos SRT ou VTT, útil se planea emparellar o son co vídeo máis tarde, ou para accesibilidade en páxinas de podcasts só de son.
Si. Cada transcrición ábrese no editor incorporado onde pode corrixir palabras, mudar o nome dos oradores, axustar os selos de data e hora e engadir notas. As edicións persisten nas exportacións.
Cada transcrición obtén un URL único compartible. Exporte a DOCX ou PDF para enviar por correo electrónico, ou comparta a ligazón directamente. Os plans Pro engadirán protección con contrasinal e ligazóns permanentes, útiles se o seu contido OGG impulsa o traballo continuo do cliente.
STT.ai soporta envíos de URL desde máis de 1300 plataformas (YouTube, Vimeo, SoundCloud, servidores de podcasts, etc.). Se a fonte devolve OGG ou calquera cousa convertíbel a OGG, podemos transcribila. As fontes protexidas con DRM non se poden transcribir; para estas, descargue manualmente e envíe o ficheiro OGG directamente.