Transcribe with SenseVoice

Аудио һәм видеоны җәмәгатьчелеккә тәкъдим итү белән эшли. DRM-код белән саклау эчтәлеге ярдәм итми.

Боерылган
Private transcript
Текст белән сөйләшү
Про белән ябылу →
Файлны монда төшерегез яки эзләү өчен басыгыз
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2 ГБ кадәр
Боерылган
Private transcript
Текст белән сөйләшү
Про белән ябылу →
Боерылган
Җырлау: 0:00
Реаль вакыт Вакытлыча
Өстәмә Шәһәр (төрекчәдә)
24 гыйнвар — Мәхмүт Гәрәев, язучы. · Күзәтү 7d + аудио өчен · Про шәхси сылтамалар өчен

Реаль вакытлы сөйләмне текстка. Сез сөйләгән саен, AI аны автоматик рәвештә төзәтә - сөйләм озынрак булган саен, төгәллек яхшыра.

Башта микрофонны тикшерегез
❤️ STT.aiне яратасызмы?
Сез үзегезнең бушлай транскрипцияләрегезне кулландыгыз

600 елдан соң, 600 елдан соң, 600 елдан соң, 600 елдан соң, 600 елдан соң, 600 елдан соң, 600 елдан соң.

10 буш минут/көн 600 елда нигезләнгән. Кредит картасы юк Шифрланган
Бушлай теркәлү →
5.5%
WER
50
Languages
50.0x
Speed
MIT
License

About SenseVoice

Кайвакыт бирелә торган сораулар

SenseVoice — FunAudioLLM-нең сүздән-текстка модель. STT.ai безнең GPU инфраструктурасында урнашкан, шуңа күрә сез аны үз аппаратурагызны тәэмин итмичә куллана аласыз — аудио яки видеоны урнаштырыгыз һәм модель сайлап алучыдан SenseVoice-не сайлагыз.

SenseVoice стандарт бәяләүләрдә сүз хаталары 5.5% тәшкил итә. Реаль дөньяда дөреслек аудио сыйфатына, акцентка һәм телгә бәйле; тавышлы яки акцентлы язу өчен, WER ны берничә процентка арттырырга мөмкин.

SenseVoice STT.ai-нең бушлай дәрәҗәсендә эшли — һәрбер кунак 600 минут / ай бушлай ала. түләүле планнар файлга озынрак чикләүләр, шәхси транскрипцияләр һәм приоритетлы чиратлаштыру өсти.

SenseVoice MIT лицензиясе нигезендә чыгарыла, ул ачык чыганак лицензиясе. Сез SenseVoice-не үз җайланмагызда урнаштыра аласыз яки безнең урнаштырылган версияне куллана аласыз — икесе дә коммерцияле куллануга яраклы.

SenseVoice 50 телне яклый. Аудио өчен дөрес телне автоматик ачыклау сайлый; аны үзегезгә туры китереп тә билгеләп була, тик бу дөреслекне бераз арттыра.

SenseVoice безнең GPUларда 50.0x реаль вакыт белән аудио эшкәртә. 1 сәгатьлек аудио файл 1 минут эчендә тәмамлана; озынрак файллар чиратка куела һәм эш тәмамлангач электрон почта аша хәбәр ителә.

SenseVoiceдә 234M параметрлары бар. Зуррак модельләр төгәлрәк, ләкин зәгыйфьрәк; STT.ai SenseVoiceне график процессорда урнаштыра, шуңа күрә параметрлар саны клиент ягы эшчәнлегенә йогынты ясамый.

SenseVoice STT.ai тарафыннан якланган һәр форматны кабул итә — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI һәм башкалар.

SenseVoice сүзлекнең һәрберсе өчен сөйләүче диаризациясе эшли — һәр сөйләүчегә тамга куела һәм соңрак редакторда аларны исемнәре үзгәртелә.

Әйе. SenseVoice безнең идарә ителгән тирәлектә эшли — аудио эшкәртелә һәм юкка чыгарыла һәм ачыктан-ачык кушылмаусыз өйрәтү өчен беркайчан да кулланылмый. Про планнары клиент тарафыннан шифрлауны ялгыз трактовкаларга өсти.

SenseVoiceне башка башка ярдәм ителгән модельләр белән бер үк аудиода чагыштыру өчен compare-stt инструментын кулланыгыз — сез WER, сегментлар саны, тавыш язучылары һәм ышанычлылык күрсәткечләрен бер-бер артлы күрерсез. SenseVoice һәм Whisper Large V3 чагыштыруы иң еш кулланыла.

Әйе. /v1/transcribe ахыргы ноктасында модель параметры буларак "sensevoice"не күрсәтегез. Python һәм Node.js SDKлары SenseVoice мисалын кертәләр. Бушлай API катламы айга 100 минутны тәшкил итә.

Әйе. SenseVoice MIT-лицензияләнгән булганлыктан, сез аны үзегез урнаштыра аласыз. STT.ai'ның ачык чыганаклы битендә проектның репо һәм авырлыклары күрсәтелгән. Продукция төркемнәре безнең урнаштырылган версияне GPU сатып алу, модель алмашу һәм опсларны калдыру өчен кулланалар.