Transcribe with Moonshine

Toimii julkisesti saatavilla olevan äänen ja videon kanssa. DRM-suojattua sisältöä ei tueta.

Parannuksia parannuksiin
Private transcript
Juttele transkriptin kanssa
Avaa Pron kanssa →
Jätä tiedosto tähän tai napsauta selataksesi
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – enintään 2GB
Parannuksia parannuksiin
Private transcript
Juttele transkriptin kanssa
Avaa Pron kanssa →
Parannuksia parannuksiin
Tallennus: 0:00
Reaaliaikainen Vosk (instant)
Tehostettu Kuiskaaja (tarkka)
Julkiset linkit: 24h, vain teksti · Rekisteröidy 7d+-äänelle · Pro yksityisille linkeille

Reaaliaikainen puhe tekstiksi. Tekoäly korjaa automaattisesti puhuessasi – tarkkuus paranee pidemmällä puheella.

Testaa mikrofonisi ensin
❤️ Love STT.ai? Tell your friends!
Käytit ilmaisia transkriptioitasi.

Rekisteröidy ilmaiseksi 600 minuuttia kuukaudessa tai päivitä rajattomat transkriptiot.

10 ilmaista min/päivä 600 min ilmaiseksi ilmoittautumalla Ei luottokorttia Salattu
Rekisteröidy ilmaiseksi →
7.8%
WER
1
Languages
80.0x
Speed
MIT
License

About Moonshine

Languages Supported by Moonshine

Usein kysyttyjä kysymyksiä

Moonshine on Useful Sensors:n puheesta tekstiin -malli. STT.ai isännöi Moonshine:ta GPU-infrastruktuurissamme, joten voit käyttää sitä ilman, että varaat omia laitteitasi – lataat äänen tai videon ja valitset Moonshine mallinnostolaitteesta.

Standardimittauksissa Moonshine saavuttaa noin 8801 prosentin Word Error Rate -arvon. Todellisen maailman tarkkuus riippuu äänenlaadusta, aksentista ja kielestä; äänekkäiden tai korostuneiden äänitteiden osalta WER:n odotetaan olevan muutaman prosenttiyksikön korkeampi.

Moonshine kulkee STT.ai:n ilmaisella kerroksella – jokainen kävijä saa 600 minuuttia kuukaudessa maksutta. Maksettuihin suunnitelmiin lisätään pidempiä tiedostokohtaisia raja-arvoja, yksityisiä selostuksia ja ensisijaisuusjonoa.

Moonshine julkaistaan sallivan avoimen lähdekoodin lisenssin alla. Voit itse isännöidä Moonshine:ta omalla laitteistollasi tai käyttää isäntäversiotamme – molemmat ovat kaupallisesti käyttökelpoisia.

Moonshine tukee 1 kieltä. Automaattinen havainnointi valitsee oikean kielen useimmille äänille; voit myös määrittää sen manuaalisesti pientä tarkkuusnosturia varten.

Moonshine prosessorin äänentoisto noin 80.0x reaaliaikaisesti GPU:issa. Tunnin äänitiedosto valmistuu alle 1 minuutissa, pidempi tiedostojono ja ilmoitus sähköpostitse, kun se on tehty.

Moonshine:ssa on 61M parametria. Suuremmat mallit ovat yleensä tarkempia, mutta hitaampia; STT.ai isännöi Moonshine:a GPU:ssa, joten parametrien määrä ei vaikuta asiakaspuolen suorituskykyyn.

Moonshine hyväksyy jokaisen formaatin STT.ai tukea: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ja muut. Tuotos on TXT, SRT, VTT, DOCX, JSON tai PDF.

Kyllä. Kaiuttimen diarisointi kulkee Moonshine:n rinnalla jokaista transkriptiota kohden – jokainen puhuja on merkitty, ja voit nimetä sen myöhemmin uudelleen päätoimittajaksi.

Kyllä. Moonshine kulkee hallitussa ympäristössämme – ääntä käsitellään ja poistetaan oletuksena, eikä sitä koskaan käytetä harjoitteluun ilman nimenomaista opt-iniä. Pro suunnittelee lisäävänsä asiakaspuolen salauksen selostuksiin levossa.

Verrattuna ensimmäiseen työkaluun voit ajaa Moonshine muuta saman äänen avulla tuettua mallia vastaan – näet WER:n, segmentin, kaiuttimen tarroja ja itseluottamuspisteitä vierekkäin. Moonshine vs. Whisper Large V3 -vertailu on yleisin.

Kyllä. Määrittele "moonshine" mallimuuttujaksi /v1/transcribe-päätetapahtumassa. Python ja Node.js SDKs sisältävät Moonshine esimerkkiä. Vapaa API-taso sisältää 100 minuuttia kuukaudessa.

Kyllä. Koska Moonshine on MIT-lisensoitu, voit itse isännöidä sitä. STT.ai:n avoimen lähdekoodin sivulla on listattu projektin repo ja painot. Useimmat tuotantoryhmät käyttävät isäntäversiotamme jättääkseen GPU-hankinnat, mallivaihdot ja opsit väliin.