Tilkynna villu / Feature Request

Umrita með SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Virkar með almenningi tiltækum hljóð og myndskeið. DRM-varið efni er ekki stutt.

Uppfærsla fyrir Enhanced

Einkaútgáfa

Spjallaðu með afritun

Opna með Pro →

Slepptu skrá hér eða smelltu til að fletta

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - allt að 2GB

Senda margar skrár Með Pro

Uppfærsla fyrir Enhanced

Einkaútgáfa

Spjallaðu með afritun

Opna með Pro →

Uppfærsla fyrir Enhanced

AI leiðréttir sjálfkrafa þegar þú talar - nákvæmni bætir við lengri ræðu.

Prófaðu hljóðnemann fyrst

10 ókeypis mín / dag 600 mín ókeypis með skráningu Engin kreditkort Dulritað

Skráðu þig ókeypis →

5.5%

WER

Tungumál

50.0x

Hraði

MIT

Leyfi

Um SenseVoice

SenseVoice er talgrunnslíkan frá FunAudioLLM sem fer út fyrir uppskrift.Það styður 50 + tungumál og inniheldur getu til tilfinningagreiningar, hljóðviðburðagreiningar og öfugs textanormalization í einni líkani.

Tungumál studd af SenseVoice

Enska

Spænska

Franska

Þýska

Kínverska

Japanska

Kóreska

Portúgalska

Arabíska

Hindí

Rússneska

Ítalska

Hollenska

Tyrkneska

Pólska

Sænska

Indónesíska

Taílenska

Víetnamska

Tékkneska

Gríska

Rúmenska

Ungverska

Hebreska

Danska

Finnska

Norska

Úkraínska

Malaíska

Bengalska

Upplýsingar um líkan

VeitendurFunAudioLLM
Arkitektúr-
LeyfiMIT
UppfærtMar 2026

Tengd módel

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Algengar spurningar

STT.ai hýsir SenseVoice á GPU innviði okkar svo þú getur notað það án þess að útvega eigin vélbúnað - hlaða hljóð eða myndskeið og velja SenseVoice frá líkan picker.

Á venjulegum viðmiðum nær SenseVoice um 5.5% orðvillahlutfall. Nákvæmni í raunveruleikanum fer eftir hljóðgæðum, hreim og tungumáli. Fyrir háværar eða hreimlegar upptökur skal búast við nokkrum prósentustigum hærri WER.

SenseVoice keyrir á STT.ai's ókeypis stigi - hver gestur fær 600 mínútur til að byrja án kostnaðar.Gjaldið áætlanir bæta lengri skráarmörk, einka afritunar og forgangsröðun.

SenseVoice er gefið út undir MIT, leyfilegt opið afnotaleyfi.Þú getur sjálf-hýsa SenseVoice á eigin vélbúnaði eða nota hýsta útgáfu okkar - bæði eru nothæf í atvinnuskyni.

SenseVoice styður 50 tungumál. Sjálfvirk greining velur rétt tungumál fyrir flest hljóð. Þú getur einnig tilgreint það handvirkt til að ná nákvæmni.

SenseVoice vinnur hljóð á um 50.0x rauntíma á GPU okkar.1 klukkustund hljóðskrá lýkur í undir 1 mínútur; lengri skrár biðröð og tilkynna með tölvupósti þegar gert.

Stærri gerðir hafa tilhneigingu til að vera nákvæmari en hægari; STT.ai hýsir SenseVoice á GPU þannig að fjöldi breytna hefur ekki áhrif á frammistöðu biðlara.

SenseVoice samþykkir hvert snið STT.ai styður - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI og aðrir.Output sem TXT, SRT, VTT, DOCX, JSON, eða PDF.

Hátalari diarization keyrir ásamt SenseVoice fyrir hverja uppskrift - hver hátalari er merkt og þú getur endurnefnt þá í ritlinum eftir það.

Já. SenseVoice keyrir í stjórnað umhverfi okkar - hljóð er unnið og eytt sjálfgefið og aldrei notað til þjálfunar án þess að skýrt sé valið. Pro áætlanir bæta við dulkóðun á viðskiptavinarhlið fyrir afritunarefni í hvíld.

Notaðu samanburðar-stt tólið til að keyra SenseVoice gegn öðrum studdum líkani á sama hljóðinu - þú munt sjá WER, hlutatölu, hátalaramerki og traust stig hlið við hlið.SenseVoice vs Whisper Large V3 samanburður er algengasta hlaupið.

Já. Tilgreindu "sensevoice" sem líkan viðfang á /v1/transcribe endapunkti. Python og Node.js SDK innihalda SenseVoice dæmi. Ókeypis API tier inniheldur 100 mínútur / mánuð.

Já. Vegna þess að SenseVoice er MIT-leyfi, getur þú sjálfur hýst það. STT.ai's opinn uppspretta síðu sýnir verkefnið repo og þyngd. Flestir framleiðsluteymi nota hýsta útgáfu okkar til að sleppa GPU innkaupum, líkanskiptum og aðgerðum.

Umrita með SenseVoice

Um SenseVoice

Tungumál studd af SenseVoice

Upplýsingar um líkan

Tengd módel

Algengar spurningar

Hvað er SenseVoice?

Hversu nákvæm er SenseVoice?

Er SenseVoice frjálst að nota?

Hvađa leyfi notar SenseVoice?

Hversu mörg tungumál styður SenseVoice?

Hversu hratt er SenseVoice?

Hversu stór er SenseVoice líkanið?

Hvaða hljóð snið getur SenseVoice afrita?

Finnur SenseVoice marga hátalara?

Er gögnin mín einkamál þegar ég nota SenseVoice?

Hvernig er SenseVoice samanborið við aðrar STT gerðir?

Get ég notað SenseVoice í gegnum API?

Get ég keyrt SenseVoice á eigin miðlara mínum?