Segnala bug / richiesta di funzionalità

Politica e trasparenza dell' IA

Che cosa AI usiamo, dove funziona, e come rispettiamo gli obblighi di divulgazione (EU AI Act Article 50, effective 2026-08-02).

TL;DR

Tutte le trascrizioni sono generate da IA. Ogni uscita porta una rivelazione leggibile da una macchina.
Tutte le AI vengono eseguite sulla nostra GPU. NON inviamo il tuo audio o testo a OpenAI, Anthropic, Google o a qualsiasi API LLM di terze parti.
Non addestriamo modelli base sulle trascrizioni. Solo una fine-tune opt-in utilizza le correzioni che fai esplicitamente.
I cloni vocali sintetici (TTS) sono chiaramente etichettati come AI-generati in nome file, metadati, e sulla pagina.

Modelli che usiamo

Modello	Usato per	Licenza	Corre su
Whisper large-v3-turbo (faster-whisper)	Trascrizione (default)	MIT	La nostra GPU
STT.ai Enhanced (custom fine-tune)	Trascrizione (piani a pagamento)	MIT (base) / Proprietary (fine-tune weights)	La nostra GPU
Vosk	In tempo reale	Apache 2.0	La nostra GPU
SpeechBrain ECAPA-TDNN	Diarizzazione dei diffusori	Apache 2.0	La nostra GPU
MadLAD-400 3B	Traduzione (450+ lingue)	Apache 2.0	La nostra GPU
Qwen2.5-1.5B (llama.cpp)	Sintesi, analisi, generazione di contenuti, chat RAG	Apache 2.0	La nostra GPU
F5-TTS	Clonazione vocale / testo a voce	MIT	La nostra GPU
all-MiniLM-L6-v2	Inserzioni per la ricerca RAG	Apache 2.0	La nostra GPU

Non chiamiamo OpenAI, Anthropic, Google Cloud o qualsiasi API LLM di terze parti per qualsiasi funzionalità. Ogni modello sopra eseguito su hardware che possediamo e operiamo. L'unico servizio esterno AI che utilizziamo è translateapi.ai (anche Muddy Holdings) per tradurre stringhe UI.

Come divulghiamo la generazione di AI

Pagine HTML dei trascrizioni: include <meta name=\
Esportazione di testi (TXT, SRT, VTT, JSON, CSV, DOCX, PDF): include una riga di intestazione 'AI-generata' nella parte superiore di ogni file.
Voce sintetica / Uscita TTS: I file WAV includono un tag'sintetico-voce' nei metadati e una chiara comunicazione sulla pagina di download. Disclaimer acustico è sulla roadmap.
Risposte API: includere un _ai_generato: vero campo in ogni risposta JSON che contiene contenuti trascritti.

Dati relativi alla formazione

I modelli base (Whisper, MadLAD, Qwen, ecc.) vengono pre-allenati dai rispettivi editori.
Le trascrizioni NON sono utilizzate per addestrare i modelli base.
Se correggi un segmento di trascrizione (l'icona della matita) o lo segni in modo errato (l'icona della bandiera), e hai optato per /privacy-settings/ (\
Separatamente, le correzioni Contribuisci più audio a Voice Lab toggle (anche a /privacy-settings/, anche di default off) ti opta per contribuire all'audio dei segmenti corretti, abbinati al testo corretto, al nostro set di dati Voice Lab sotto CC-BY-SA-4. I due toggle sono indipendenti.
Audio caricato viene eliminato entro 24 ore tramite il cleanup_uploads cron Hoppenstedt UNLESS avete scelto di \

Precisione ed errori

La trascrizione AI non è perfetta. I tassi di errore delle parole variano in base all'accento degli altoparlanti, alla qualità audio, alla lingua e al vocabolario di dominio. Per uso critico (industria legale, medicale, regolamentata) verificare l'audio originale. I nostri benchmark WER pubblici per modello sono a /models/.

Domande di conformità

Per EU AI Act, GDPR o altre domande di conformità: hello@stt.ai o utilizzare il modulo di contatto.

Ultimo aggiornamento: 2026-04-26.