Fehler melden / Feature-Anforderung

Beschriftung mit NVIDIA Canary

Name: NVIDIA Canary
Author: NVIDIA

Funktioniert mit öffentlich zugänglichem Audio & Video. DRM-geschützte Inhalte werden nicht unterstützt.

Upgrade für Verbesserte

Privater Abschriften

Chatten Sie mit Transkript

Entsperren mit Pro →

Drop-Datei hier oder klicken Sie zum Durchsuchen

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — bis zu 2 GB

Batch lädt mehrere Dateien hoch mit Pro

Upgrade für Verbesserte

Privater Abschriften

Chatten Sie mit Transkript

Entsperren mit Pro →

Upgrade für Verbesserte

Echtzeit-Sprache zu Text. AI-Auto-Korrekturen, wie Sie sprechen – Genauigkeit verbessert sich mit längeren Sprache.

Testen Sie zuerst Ihr Mikrofon

10 kostenlos min/Tag 600 min frei mit Anmeldung Keine Kreditkarte Verschlüsselt

Melde dich kostenlos an →

3.5%

WER

Sprachen

45.0x

Geschwindigkeit

CC-BY-4.0

Lizenz

Über NVIDIA Canary

NVIDIA Canary ist ein 1B-Parametermodell, das sich bei der englischen, deutschen, französischen und spanischen Transkription auszeichnet. Es basiert auf dem NeMo-Framework und verwendet einen FastConformer-Encoder mit einem Transformator-Decoder und unterstützt die automatische Spracherkennung und Übersetzung.

Sprachen unterstützt von NVIDIA Canary

Englisch

Spanisch

Französisch

Deutsch

Modellinformation

AnbieterNVIDIA
Architektur-
LizenzCC-BY-4.0
AktualisiertMar 2026

Häufig gestellte Fragen

NVIDIA Canary ist ein Sprach-zu-Text-Modell von NVIDIA. STT.ai Hosts NVIDIA Canary auf unserer GPU-Infrastruktur, so dass Sie es ohne Bereitstellung Ihrer eigenen Hardware nutzen können – laden Sie Audio oder Video hoch und wählen Sie NVIDIA Canary vom Modellpicker.

Auf Standard-Benchmarks erreicht NVIDIA Canary rund 3.5% Word Error Rate. Real-Welt-Genauigkeit hängt von Audio-Qualität, Akzent und Sprache; für laute oder akzentuierte Aufnahmen, erwarten ein paar Prozentpunkte höher WER.

NVIDIA Canary läuft auf STT.ais freier Ebene – jeder Besucher erhält 600 Minuten, um kostenlos zu starten. Bezahlte Pläne fügen längere pro-Datei-Grenzen, private Transkripte und Priorität Warteschlange hinzu.

NVIDIA Canary wird unter CC-BY-4.0 veröffentlicht, einer permissiven Open-Source-Lizenz. Sie können NVIDIA Canary auf Ihrer eigenen Hardware selbst hosten oder unsere gehostete Version verwenden – beide sind kommerziell nutzbar.

NVIDIA Canary unterstützt 4 Sprachen. Auto-Erkennung wählt die richtige Sprache für die meisten Audio-; Sie können es auch manuell für einen kleinen Genauigkeitsheber angeben.

NVIDIA Canary verarbeitet Audio bei ca. 45.0x Echtzeit auf unseren GPUs. Eine 1-stündige Audiodatei endet in weniger als 1 Minuten; längere Dateien stehen Schlange und benachrichtigen per E-Mail, wenn getan.

NVIDIA Canary hat 1B Parameter. Größere Modelle neigen dazu, genauer, aber langsamer zu sein; STT.ai Hosts NVIDIA Canary auf GPU, so dass die Parameteranzahl Ihre clientseitige Leistung nicht beeinflusst.

NVIDIA Canary akzeptiert jedes Format STT.ai unterstützt — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI und andere. Ausgabe als TXT, SRT, VTT, DOCX, JSON oder PDF.

Ja. Die Lautsprecherdiarisierung läuft bei jeder Transkription neben NVIDIA Canary – jeder Lautsprecher ist beschriftet und Sie können sie anschließend im Editor umbenennen.

Ja. NVIDIA Canary läuft in unserer verwalteten Umgebung – Audio wird standardmäßig verarbeitet und gelöscht und nie ohne explizites Opt-In zum Training verwendet. Pro-Pläne fügen Client-seitige Verschlüsselung für Transkripte in Ruhe hinzu.

Verwenden Sie das Vergleichs-stt-Tool, um NVIDIA Canary gegen jedes andere unterstützte Modell auf dem gleichen Audio laufen zu lassen – Sie sehen WER, Segmentanzahl, Lautsprecheretiketten und Konfidenzwerte nebeneinander. Der NVIDIA Canary vs Whisper Large V3 Vergleich ist der am häufigsten ausgeführte.

Ja. Geben Sie "nvidia-canary" als Modellparameter auf dem Endpunkt /v1/transcribe an. Python und Node.js SDKs enthalten NVIDIA Canary Beispiele. Freie API-Ebene enthält 100 Minuten/Monat.

Ja. Da NVIDIA Canary CC-BY-4.0-lizenziert ist, können Sie es selbst hosten. STT.ai Open-Source-Seite listet die Projekt-Repo und Gewichte. Die meisten Produktionsteams verwenden unsere gehostete Version, um GPU Beschaffung, Modell-Swaps und Ops überspringen.

Beschriftung mit NVIDIA Canary

Über NVIDIA Canary

Sprachen unterstützt von NVIDIA Canary

Modellinformation

Verwandte Modelle

Häufig gestellte Fragen

Was ist NVIDIA Canary?

Wie genau ist NVIDIA Canary?

Ist NVIDIA Canary frei zu benutzen?

Welche Lizenz verwendet NVIDIA Canary?

Wie viele Sprachen unterstützen NVIDIA Canary?

Wie schnell sind NVIDIA Canary?

Wie groß ist das NVIDIA Canary-Modell?

Welche Audioformate können NVIDIA Canary transkribieren?

Erkennt NVIDIA Canary mehrere Lautsprecher?

Sind meine Daten privat, wenn Sie NVIDIA Canary verwenden?

Wie vergleicht NVIDIA Canary mit anderen STT-Modellen?

Kann ich NVIDIA Canary über die API verwenden?

Kann ich NVIDIA Canary auf meinem eigenen Server ausführen?