Ilmoita vika / Ominaisuuspyyntö

Määrää lääkkeellä SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Toimii julkisesti saatavilla olevan äänen ja videon kanssa. DRM-suojattua sisältöä ei tueta.

Parannuksia parannuksiin

Yksityinen transkriptio

Juttele transkriptin kanssa

Avaa Pron kanssa →

Jätä tiedosto tähän tai napsauta selataksesi

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – enintään 2GB

Erä lataa useita tiedostoja Pron kanssa

Parannuksia parannuksiin

Yksityinen transkriptio

Juttele transkriptin kanssa

Avaa Pron kanssa →

Parannuksia parannuksiin

Reaaliaikainen puhe tekstiksi. Tekoäly korjaa automaattisesti puhuessasi – tarkkuus paranee pidemmällä puheella.

Testaa mikrofonisi ensin

10 ilmaista min/päivä 600 min ilmaiseksi ilmoittautumalla Ei luottokorttia Salattu

Rekisteröidy ilmaiseksi →

5.5%

WER

Kielet

50.0x

Nopeus

MIT

Lisenssi

Tietoja SenseVoice

SenseVoice on FunAudioLLM:n puhesäätiömalli, joka ulottuu transkriptiota pidemmälle. Se tukee yli 50:tä kieltä ja sisältää kyvyt tunteiden tunnistamiseen, äänitapahtumien havaitsemiseen ja tekstin normalisointiin yhdessä mallissa.

Kieliä tuetaan SenseVoice

Englanti

Espanja

Ranska

Saksa

Kiina

Japani

Korea

Portugali

Arabia

Hindi

Venäjä

Italia

Hollanti

Turkki

Puola

Ruotsi

Indonesia

Thai

Vietnam

Tšekki

Kreikka

Romania

Unkari

Heprea

Tanska

Suomi

Norja

Ukraina

Malaiji

Bengali

Malli-info

PalveluntarjoajaFunAudioLLM
Arkkitehtuuri-
LisenssiMIT
PäivitettyMar 2026

Aiheeseen liittyvät mallit

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Usein kysyttyjä kysymyksiä

SenseVoice on FunAudioLLM:n puheesta tekstiin -malli. STT.ai isännöi SenseVoice:ta GPU-infrastruktuurissamme, joten voit käyttää sitä ilman, että varaat omia laitteitasi – lataat äänen tai videon ja valitset SenseVoice mallinnostolaitteesta.

Standardimittauksissa SenseVoice saavuttaa noin 8801 prosentin Word Error Rate -arvon. Todellisen maailman tarkkuus riippuu äänenlaadusta, aksentista ja kielestä; äänekkäiden tai korostuneiden äänitteiden osalta WER:n odotetaan olevan muutaman prosenttiyksikön korkeampi.

SenseVoice kulkee STT.ai:n vapaalla tasolla – jokainen vierailija saa 600 minuuttia aikaa aloittaa ilmaiseksi. Maksetut suunnitelmat lisäävät tiedostojen välisiä rajoja, yksityisiä selostuksia ja jonottamista.

SenseVoice julkaistaan sallivan avoimen lähdekoodin lisenssin alla. Voit itse isännöidä SenseVoice:ta omalla laitteistollasi tai käyttää isäntäversiotamme – molemmat ovat kaupallisesti käyttökelpoisia.

SenseVoice tukee 50 kieltä. Automaattinen havainnointi valitsee oikean kielen useimmille äänille; voit myös määrittää sen manuaalisesti pientä tarkkuusnosturia varten.

SenseVoice prosessorin äänentoisto noin 50.0x reaaliaikaisesti GPU:issa. Tunnin äänitiedosto valmistuu alle 1 minuutissa, pidempi tiedostojono ja ilmoitus sähköpostitse, kun se on tehty.

SenseVoice:ssa on 234M parametria. Suuremmat mallit ovat yleensä tarkempia, mutta hitaampia; STT.ai isännöi SenseVoice:a GPU:ssa, joten parametrien määrä ei vaikuta asiakaspuolen suorituskykyyn.

SenseVoice hyväksyy jokaisen formaatin STT.ai tukea: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ja muut. Tuotos on TXT, SRT, VTT, DOCX, JSON tai PDF.

Kyllä. Kaiuttimen diarisointi kulkee SenseVoice:n rinnalla jokaista transkriptiota kohden – jokainen puhuja on merkitty, ja voit nimetä sen myöhemmin uudelleen päätoimittajaksi.

Kyllä. SenseVoice kulkee hallitussa ympäristössämme – ääntä käsitellään ja poistetaan oletuksena, eikä sitä koskaan käytetä harjoitteluun ilman nimenomaista opt-iniä. Pro suunnittelee lisäävänsä asiakaspuolen salauksen selostuksiin levossa.

Verrattuna ensimmäiseen työkaluun voit ajaa SenseVoice muuta saman äänen avulla tuettua mallia vastaan – näet WER:n, segmentin, kaiuttimen tarroja ja itseluottamuspisteitä vierekkäin. SenseVoice vs. Whisper Large V3 -vertailu on yleisin.

Kyllä. Määrittele "sensevoice" mallimuuttujaksi /v1/transcribe-päätetapahtumassa. Python ja Node.js SDKs sisältävät SenseVoice esimerkkiä. Vapaa API-taso sisältää 100 minuuttia kuukaudessa.

Kyllä. Koska SenseVoice on MIT-lisensoitu, voit itse isännöidä sitä. STT.ai:n avoimen lähdekoodin sivulla on listattu projektin repo ja painot. Useimmat tuotantoryhmät käyttävät isäntäversiotamme jättääkseen GPU-hankinnat, mallivaihdot ja opsit väliin.

Määrää lääkkeellä SenseVoice

Tietoja SenseVoice

Kieliä tuetaan SenseVoice

Malli-info

Aiheeseen liittyvät mallit

Usein kysyttyjä kysymyksiä

Mikä on SenseVoice?

Kuinka tarkka on SenseVoice?

Onko SenseVoice ilmaista käyttöä?

Mitä lisenssiä SenseVoice käyttää?

Kuinka monta kieltä SenseVoice kannattaa?

Kuinka nopea on SenseVoice?

Kuinka iso on SenseVoice-malli?

Mitä ääniformaatteja SenseVoice voi kirjoittaa?

Havaitseeko SenseVoice useita puhujia?

Ovatko tietoni yksityisiä, kun käytän SenseVoice:ta?

Miten SenseVoice vertautuu muihin STT-malleihin?

Voinko käyttää SenseVoice API:n kautta?

Voinko ajaa SenseVoice omalla palvelimellani?