Transkribieren mit Moonshine

Funktioniert mit öffentlich zugänglichem Audio & Video. DRM-geschützte Inhalte werden nicht unterstützt.

Upgrade für Verbesserte
Private transcript
Chatten Sie mit Transkript
Entsperren mit Pro →
Drop-Datei hier oder klicken Sie zum Durchsuchen
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — bis zu 2 GB
Upgrade für Verbesserte
Private transcript
Chatten Sie mit Transkript
Entsperren mit Pro →
Upgrade für Verbesserte
Aufzeichnung: 0:00
In Echtzeit Vosk (instant)
Verstärkt Flüstern (genau)
Öffentliche Links: 24h, nur Text · Melden Sie sich an für 7d + Audio · Pro für private Links

Echtzeit-Sprache zu Text. AI-Auto-Korrekturen, wie Sie sprechen – Genauigkeit verbessert sich mit längeren Sprache.

Testen Sie zuerst Ihr Mikrofon
❤️ Liebe STT.ai? Erzählen Sie Ihren Freunden!
Du hast deine freien Transkriptionen benutzt.

Melden Sie sich kostenlos an, um 600 Minuten/Monat zu erhalten, oder aktualisieren Sie für unbegrenzte Transkriptionen.

10 kostenlos min/Tag 600 min frei mit Anmeldung Keine Kreditkarte Verschlüsselt
Melde dich kostenlos an →
7.8%
WER
1
Languages
80.0x
Speed
MIT
License

Über Moonshine

Moonshine is an extremely compact speech-to-text model designed for resource-constrained environments. At only 61M parameters, it runs efficiently on edge devices like Raspberry Pi while maintaining reasonable English transcription accuracy.

Unterstützte Sprachen von Moonshine

Häufig gestellte Fragen

Moonshine ist ein Sprach-zu-Text-Modell von Useful Sensors. STT.ai Hosts Moonshine auf unserer GPU-Infrastruktur, so dass Sie es ohne Bereitstellung Ihrer eigenen Hardware nutzen können – laden Sie Audio oder Video hoch und wählen Sie Moonshine vom Modellpicker.

Auf Standard-Benchmarks erreicht Moonshine rund 7.8% Word Error Rate. Real-Welt-Genauigkeit hängt von Audio-Qualität, Akzent und Sprache; für laute oder akzentuierte Aufnahmen, erwarten ein paar Prozentpunkte höher WER.

Moonshine läuft auf STT.ai's Free-Tier - jeder Besucher erhält 600 Minuten/Monat ohne Kosten. Bezahlte Pläne fügen mehr pro-Datei Grenzen, private Transkripte, und Priorität Warteschlange.

Moonshine wird unter MIT veröffentlicht, einer permissiven Open-Source-Lizenz. Sie können Moonshine auf Ihrer eigenen Hardware selbst hosten oder unsere gehostete Version verwenden – beide sind kommerziell nutzbar.

Moonshine unterstützt 1 Sprachen. Auto-Erkennung wählt die richtige Sprache für die meisten Audio-; Sie können es auch manuell für einen kleinen Genauigkeitsheber angeben.

Moonshine verarbeitet Audio bei ca. 80.0x Echtzeit auf unseren GPUs. Eine 1-stündige Audiodatei endet in weniger als 1 Minuten; längere Dateien stehen Schlange und benachrichtigen per E-Mail, wenn getan.

Moonshine hat 61M Parameter. Größere Modelle neigen dazu, genauer, aber langsamer zu sein; STT.ai Hosts Moonshine auf GPU, so dass die Parameteranzahl Ihre clientseitige Leistung nicht beeinflusst.

Moonshine akzeptiert jedes Format STT.ai unterstützt — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI und andere. Ausgabe als TXT, SRT, VTT, DOCX, JSON oder PDF.

Ja. Die Lautsprecherdiarisierung läuft bei jeder Transkription neben Moonshine – jeder Lautsprecher ist beschriftet und Sie können sie anschließend im Editor umbenennen.

Ja. Moonshine läuft in unserer verwalteten Umgebung – Audio wird standardmäßig verarbeitet und gelöscht und nie ohne explizites Opt-In zum Training verwendet. Pro-Pläne fügen Client-seitige Verschlüsselung für Transkripte in Ruhe hinzu.

Verwenden Sie das Vergleichs-stt-Tool, um Moonshine gegen jedes andere unterstützte Modell auf dem gleichen Audio laufen zu lassen – Sie sehen WER, Segmentanzahl, Lautsprecheretiketten und Konfidenzwerte nebeneinander. Der Moonshine vs Whisper Large V3 Vergleich ist der am häufigsten ausgeführte.

Ja. Geben Sie "moonshine" als Modellparameter auf dem Endpunkt /v1/transcribe an. Python und Node.js SDKs enthalten Moonshine Beispiele. Freie API-Ebene enthält 100 Minuten/Monat.

Ja. Da Moonshine MIT-lizenziert ist, können Sie es selbst hosten. STT.ai Open-Source-Seite listet die Projekt-Repo und Gewichte. Die meisten Produktionsteams verwenden unsere gehostete Version, um GPU Beschaffung, Modell-Swaps und Ops überspringen.