Transcribe with SenseVoice

Veikia su viešai prieinama garso ir vaizdo medžiaga. DRM apsaugotas turinys nepalaikomas.

Atnaujinti tobulinimui
Private transcript
Pokalbis su stenograma
Atrakinti su Pro →
Numeskite failą čia arba spustelėkite norėdami naršyti
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – iki 2GB
Atnaujinti tobulinimui
Private transcript
Pokalbis su stenograma
Atrakinti su Pro →
Atnaujinti tobulinimui
Įrašas: 0:00
Realusis laikas Voskas (nuolat)
Sustiprintas Visper (tikslus)
Viešosios nuorodos: 24h, tik tekstas · Užsiregistruoti skirtas 7d + audio · Pro asmeniniams ryšiams

Kalbėjimas realiu laiku su tekstu. AIS auto-korekcija, kai jūs kalbate — tikslumas pagerina ilgiau kalba.

Pirmiausia patikrinkite mikrofoną
❤️ Love STT.ai? Tell your friends!
Jūs naudojote savo nemokamus transkripciją

Užsiregistruoti nemokamai gauti 600 minučių/mėnesį, arba atnaujinti neribotą transkripciją.

10 nemokamų min. per dieną 600 min be registracijos Nėra kredito kortelės Šifruojama
Užsiregistruoti nemokamai →
5.5%
WER
50
Languages
50.0x
Speed
MIT
License

About SenseVoice

Dažnai užduodami klausimai

SenseVoice yra kalbos-teksto modelis iki FunAudioLLM. STT.ai savo GPU infrastruktūroje sumontuoti SenseVoice, todėl jį galite naudoti neįrengdami savo techninės įrangos – įkelkite garso ar vaizdo ir pasirinkite SenseVoice iš modelio parinkiklis.

Dėl standartinių lyginamųjų standartų, SenseVoice pasiekia apie 8801% Word error Rate. Realaus pasaulio tikslumas priklauso nuo garso kokybės, akcentas, ir kalba; Triukšmingų ar akcentuotų įrašų, tikėtis keletą procentinių punktų didesnis WER.

SenseVoice veikia STT.ai laisvos pakopos - kiekvienas lankytojas gauna 600 minučių/mėnesį be jokių išlaidų. Mokami planai pridėti daugiau už failą ribų, privačių stenogramų, ir prioritetų eilė.

SenseVoice yra išleistas pagal MIT, leistina atviro kodo licencija. Galite savarankiškai-host SenseVoice ant savo aparatūros arba naudoti mūsų palaikomą versiją - abu yra komerciškai naudoti.

SenseVoice palaiko 50 kalbas. Automatinis aptikimas pasirenka reikiamą kalbą daugumai garso; taip pat galite nurodyti ją rankiniu būdu nedideliam tikslumui pakelti.

SenseVoice apdoroja garsą maždaug 50.0x realiu laiku mūsų GPU. 1 valandos garso failas baigiasi po 1 minučių; ilgesnis failų eilė ir apie tai praneš el. paštu, kai tai bus padaryta.

SenseVoice turi 234M parametrus. Didesni modeliai yra tikslesni, bet lėčiau; STT.ai GPU mazgai SenseVoice, todėl parametrų skaičius neturi įtakos Jūsų klientų veiklos rezultatams.

SenseVoice priima kiekvieną formatą STT.ai palaiko: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ir kt. Išvesti kaip TXT, SRT, VTT, DOCX, JSON, arba PDF.

Taip. Garsiakalbio diarizacija veikia šalia SenseVoice kiekvienam transkripcija – kiekvienas garsiakalbis yra pažymėtas ir galite pervadinti juos redaktoriuje po to.

Taip. SenseVoice veikia mūsų valdomoje aplinkoje — garso yra apdorojamas ir ištrinamas pagal nutylėjimą ir niekada naudojamas mokymui be aiškaus opt-in. Pro planai pridėti kliento pusėje šifravimo stenogramos poilsio.

Naudokite palyginimo-stt įrankis paleisti SenseVoice prieš bet kurį kitą palaikomą modelį tame pačiame garso — pamatysite WER, segmentų skaičių, garsiakalbių etiketes ir pasitikėjimo balus šalia-by-by. SenseVoice palyginti Whisper didelis V3 yra dažniausiai paleisti.

Taip. Nurodykite "sensevoice" kaip modelio parametrą /v1/tractor parametrą. Python ir Node.js SDK yra SenseVoice pavyzdžiai. Nemokama API pakopa apima 100 minučių/mėnesį.

Taip. Kadangi SenseVoice yra MIT-licencijuotas, galite patys-host jį. STT.ai atviro kodo puslapis išvardija projekto atpirkimo ir svorius. Dauguma gamybos komandos naudoja mūsų įdiegtą versiją praleisti GPU pirkimų, modelių apsikeitimo, ir ops.