Хата турында хәбәр итү / мөмкинлекләр сорау

Транскрипция SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Аудио һәм видеоны җәмәгатьчелеккә тәкъдим итү белән эшли. DRM-код белән саклау эчтәлеге ярдәм итми.

Боерылган

Үзәк китапханә

Текст белән сөйләшү

Про белән ябылу →

Файлны монда төшерегез яки эзләү өчен басыгыз

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2 ГБ кадәр

Берничә файлны берьюлы йөкләү Про

Боерылган

Үзәк китапханә

Текст белән сөйләшү

Про белән ябылу →

Боерылган

Реаль вакытлы сөйләмне текстка. Сез сөйләгән саен, AI аны автоматик рәвештә төзәтә - сөйләм озынрак булган саен, төгәллек яхшыра.

Башта микрофонны тикшерегез

10 буш минут/көн 600 елда нигезләнгән. Кредит картасы юк Шифрланган

Бушлай теркәлү →

5.5%

WER

Телләр

50.0x

Тезлек

MIT

Лицензия

Бәйләнешләр SenseVoice

SenseVoice - FunAudioLLM-ның транскрипциядән тыш сөйләшү нигезе моделе. Ул 50+ телне яклый һәм бер модельдә хисләрне таныу, аудио вакыйгаларны ачыклау һәм кире текст нормализациясе мөмкинлекләрен кертә.

Кулланучы телләр SenseVoice

Инглиз

Испан

Француз

Алман

Кытай

Япон

Корея

Португал

Гарәп

Һинд

Рус

Итальян

Голланд

Төрек

Поляк

Швед

Индонезия

Тай

Вьетнам

Чех

Грек

Румын

Венгр

Яһүд

Дания

Фин

Norwegian

Украин

Малай

Бенгали

Модель мәгълүматы

ПровайдерFunAudioLLM
Архитектура-
ЛицензияMIT
ЯңартуMar 2026

Моделләр

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Кайвакыт бирелә торган сораулар

SenseVoice — FunAudioLLM-нең сүздән-текстка модель. STT.ai безнең GPU инфраструктурасында урнашкан, шуңа күрә сез аны үз аппаратурагызны тәэмин итмичә куллана аласыз — аудио яки видеоны урнаштырыгыз һәм модель сайлап алучыдан SenseVoice-не сайлагыз.

SenseVoice стандарт бәяләүләрдә сүз хаталары 5.5% тәшкил итә. Реаль дөньяда дөреслек аудио сыйфатына, акцентка һәм телгә бәйле; тавышлы яки акцентлы язу өчен, WER ны берничә процентка арттырырга мөмкин.

SenseVoice STT.ai ның бушлай дәрәҗәсендә эшли — һәрбер кунак 600 минутка бушлай старт ала. түләүле планнар файлга озынрак чикләүләр, шәхси транскрипцияләр һәм приоритетлы чиратлаштыру өсти.

SenseVoice MIT лицензиясе нигезендә чыгарыла, ул ачык чыганак лицензиясе. Сез SenseVoice-не үз җайланмагызда урнаштыра аласыз яки безнең урнаштырылган версияне куллана аласыз — икесе дә коммерцияле куллануга яраклы.

SenseVoice 50 телне яклый. Аудио өчен дөрес телне автоматик ачыклау сайлый; аны үзегезгә туры китереп тә билгеләп була, тик бу дөреслекне бераз арттыра.

SenseVoice безнең GPUларда 50.0x реаль вакыт белән аудио эшкәртә. 1 сәгатьлек аудио файл 1 минут эчендә тәмамлана; озынрак файллар чиратка куела һәм эш тәмамлангач электрон почта аша хәбәр ителә.

SenseVoiceдә 234M параметрлары бар. Зуррак модельләр төгәлрәк, ләкин зәгыйфьрәк; STT.ai SenseVoiceне график процессорда урнаштыра, шуңа күрә параметрлар саны клиент ягы эшчәнлегенә йогынты ясамый.

SenseVoice STT.ai тарафыннан якланган һәр форматны кабул итә — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI һәм башкалар.

SenseVoice сүзлекнең һәрберсе өчен сөйләүче диаризациясе эшли — һәр сөйләүчегә тамга куела һәм соңрак редакторда аларны исемнәре үзгәртелә.

Әйе. SenseVoice безнең идарә ителгән тирәлектә эшли — аудио эшкәртелә һәм юкка чыгарыла һәм ачыктан-ачык кушылмаусыз өйрәтү өчен беркайчан да кулланылмый. Про планнары клиент тарафыннан шифрлауны ялгыз трактовкаларга өсти.

SenseVoiceне башка башка ярдәм ителгән модельләр белән бер үк аудиода чагыштыру өчен compare-stt инструментын кулланыгыз — сез WER, сегментлар саны, тавыш язучылары һәм ышанычлылык күрсәткечләрен бер-бер артлы күрерсез. SenseVoice һәм Whisper Large V3 чагыштыруы иң еш кулланыла.

Әйе. /v1/transcribe ахыргы ноктасында модель параметры буларак "sensevoice"не күрсәтегез. Python һәм Node.js SDKлары SenseVoice мисалын кертәләр. Бушлай API катламы айга 100 минутны тәшкил итә.

Әйе. SenseVoice MIT-лицензияләнгән булганлыктан, сез аны үзегез урнаштыра аласыз. STT.ai'ның ачык чыганаклы битендә проектның репо һәм авырлыклары күрсәтелгән. Продукция төркемнәре безнең урнаштырылган версияне GPU сатып алу, модель алмашу һәм опсларны калдыру өчен кулланалар.

Транскрипция SenseVoice

Бәйләнешләр SenseVoice

Кулланучы телләр SenseVoice

Модель мәгълүматы

Моделләр

Кайвакыт бирелә торган сораулар

880 санның цифрлар тапкырчыгышы — 8.

880 санның цифрлар тапкырчыгышы — 8.

880 санның цифрлар тапкырчыгышы — 100.

880 санның цифрлар тапкырчыгышы — 8.

SenseVoice күпме телне яклый?

880 санның цифрлар тапкырчыгышы — 8.

880 санның цифрлар тапкырчыгышы — 8.

880 санның цифрлар суммасы — 10.

880 санның цифрлар тапкырчыгышы — 20.

SenseVoice кулланганда минем мәгълүматлар шәхсиме?

880 санның цифрлар суммасы — 13.

SenseVoice дән артык кеше яши.

SenseVoice-нче санның цифрлар тапкырчыгышы — 8.