Pranešti apie klaidą / funkcijų užklausą

Atsekti SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Veikia su viešai prieinama garso ir vaizdo medžiaga. DRM apsaugotas turinys nepalaikomas.

Atnaujinti tobulinimui

Privatus stenograma

Pokalbis su stenograma

Atrakinti su Pro →

Numeskite failą čia arba spustelėkite norėdami naršyti

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – iki 2GB

Partijos įkelti kelis failus su Pro

Atnaujinti tobulinimui

Privatus stenograma

Pokalbis su stenograma

Atrakinti su Pro →

Atnaujinti tobulinimui

Kalbėjimas realiu laiku su tekstu. AIS auto-korekcija, kai jūs kalbate — tikslumas pagerina ilgiau kalba.

Pirmiausia patikrinkite mikrofoną

10 nemokamų min. per dieną 600 min be registracijos Nėra kredito kortelės Šifruojama

Užsiregistruoti nemokamai →

5.5%

WER

Kalbos

50.0x

Greitis

MIT

Licencija

Apie SenseVoice

SenseVoice yra kalbos fondo FunAudioLLM modelis, kuris apima ne tik transkripciją. Jis palaiko 50+ kalbų ir apima galimybes emocijų atpažinimo, garso įvykių nustatymo ir atvirkštinio teksto normalizavimo viename modelyje.

Kalbos remiamos SenseVoice

Anglų

Ispanų

Prancūzų

Vokiečių

Kinų

Japonų

Korėjiečių

Portugalų

Arabų

Hindi

Rusų

Italų

Olandų

Turkų

Lenkų

Švedų

Indoneziečių

Tajų

Vietnamiečių

Čekų

Graikų

Rumunų

Vengrų

Hebrajų

Danų

Suomių

Norvegų

Ukrainiečių

Malajiečių

Bengalų

Pavyzdinės informacijos

TeikėjasFunAudioLLM
Architektūra-
LicencijaMIT
AtnaujintaMar 2026

Susiję modeliai

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Dažnai užduodami klausimai

SenseVoice yra kalbos-teksto modelis iki FunAudioLLM. STT.ai savo GPU infrastruktūroje sumontuoti SenseVoice, todėl jį galite naudoti neįrengdami savo techninės įrangos – įkelkite garso ar vaizdo ir pasirinkite SenseVoice iš modelio parinkiklis.

Dėl standartinių lyginamųjų standartų, SenseVoice pasiekia apie 8801% Word error Rate. Realaus pasaulio tikslumas priklauso nuo garso kokybės, akcentas, ir kalba; Triukšmingų ar akcentuotų įrašų, tikėtis keletą procentinių punktų didesnis WER.

SenseVoice veikia STT.ai laisvų pakopų – kiekvienas lankytojas gauna 600 minučių pradėti be jokios kainos. Mokami planai pridėti daugiau per failą ribų, privačių stenogramų, ir prioritetinių eilė.

SenseVoice yra išleistas pagal MIT, leistina atviro kodo licencija. Galite savarankiškai-host SenseVoice ant savo aparatūros arba naudoti mūsų palaikomą versiją - abu yra komerciškai naudoti.

SenseVoice palaiko 50 kalbas. Automatinis aptikimas pasirenka reikiamą kalbą daugumai garso; taip pat galite nurodyti ją rankiniu būdu nedideliam tikslumui pakelti.

SenseVoice apdoroja garsą maždaug 50.0x realiu laiku mūsų GPU. 1 valandos garso failas baigiasi po 1 minučių; ilgesnis failų eilė ir apie tai praneš el. paštu, kai tai bus padaryta.

SenseVoice turi 234M parametrus. Didesni modeliai yra tikslesni, bet lėčiau; STT.ai GPU mazgai SenseVoice, todėl parametrų skaičius neturi įtakos Jūsų klientų veiklos rezultatams.

SenseVoice priima kiekvieną formatą STT.ai palaiko: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ir kt. Išvesti kaip TXT, SRT, VTT, DOCX, JSON, arba PDF.

Taip. Garsiakalbio diarizacija veikia šalia SenseVoice kiekvienam transkripcija – kiekvienas garsiakalbis yra pažymėtas ir galite pervadinti juos redaktoriuje po to.

Taip. SenseVoice veikia mūsų valdomoje aplinkoje — garso yra apdorojamas ir ištrinamas pagal nutylėjimą ir niekada naudojamas mokymui be aiškaus opt-in. Pro planai pridėti kliento pusėje šifravimo stenogramos poilsio.

Naudokite palyginimo-stt įrankis paleisti SenseVoice prieš bet kurį kitą palaikomą modelį tame pačiame garso — pamatysite WER, segmentų skaičių, garsiakalbių etiketes ir pasitikėjimo balus šalia-by-by. SenseVoice palyginti Whisper didelis V3 yra dažniausiai paleisti.

Taip. Nurodykite "sensevoice" kaip modelio parametrą /v1/tractor parametrą. Python ir Node.js SDK yra SenseVoice pavyzdžiai. Nemokama API pakopa apima 100 minučių/mėnesį.

Taip. Kadangi SenseVoice yra MIT-licencijuotas, galite patys-host jį. STT.ai atviro kodo puslapis išvardija projekto atpirkimo ir svorius. Dauguma gamybos komandos naudoja mūsų įdiegtą versiją praleisti GPU pirkimų, modelių apsikeitimo, ir ops.

Atsekti SenseVoice

Apie SenseVoice

Kalbos remiamos SenseVoice

Pavyzdinės informacijos

Susiję modeliai

Dažnai užduodami klausimai

Kas yra SenseVoice?

Kiek tikslūs yra SenseVoice?

Ar SenseVoice laisva naudoti?

Kokią licenciją naudoja SenseVoice?

Kiek kalbų palaiko SenseVoice?

Kaip greitai yra SenseVoice?

Kiek didelis yra SenseVoice modelis?

Kokie garso formatai gali perrašyti SenseVoice?

Ar SenseVoice aptikti kelis garsiakalbius?

Ar mano duomenys privatūs naudojant SenseVoice?

Kaip palyginti su kitais STT modeliais SenseVoice?

Ar galiu naudoti SenseVoice per API?

Ar galiu paleisti SenseVoice savo serveryje?