Transcribe with Whisper Large V3

Аудио һәм видеоны җәмәгатьчелеккә тәкъдим итү белән эшли. DRM-код белән саклау эчтәлеге ярдәм итми.

Боерылган
Private transcript
Текст белән сөйләшү
Про белән ябылу →
Файлны монда төшерегез яки эзләү өчен басыгыз
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2 ГБ кадәр
Боерылган
Private transcript
Текст белән сөйләшү
Про белән ябылу →
Боерылган
Җырлау: 0:00
Реаль вакыт Вакытлыча
Өстәмә Шәһәр (төрекчәдә)
24 гыйнвар — Мәхмүт Гәрәев, язучы. · Күзәтү 7d + аудио өчен · Про шәхси сылтамалар өчен

Реаль вакытлы сөйләмне текстка. Сез сөйләгән саен, AI аны автоматик рәвештә төзәтә - сөйләм озынрак булган саен, төгәллек яхшыра.

Башта микрофонны тикшерегез
❤️ STT.aiне яратасызмы?
Сез үзегезнең бушлай транскрипцияләрегезне кулландыгыз

600 елдан соң, 600 елдан соң, 600 елдан соң, 600 елдан соң, 600 елдан соң, 600 елдан соң, 600 елдан соң.

10 буш минут/көн 600 елда нигезләнгән. Кредит картасы юк Шифрланган
Бушлай теркәлү →
4.2%
WER
99
Languages
8.0x
Speed
MIT
License

About Whisper Large V3

Кайвакыт бирелә торган сораулар

Whisper Large V3 — OpenAI-нең сүздән-текстка модель. STT.ai безнең GPU инфраструктурасында урнашкан, шуңа күрә сез аны үз аппаратурагызны тәэмин итмичә куллана аласыз — аудио яки видеоны урнаштырыгыз һәм модель сайлап алучыдан Whisper Large V3-не сайлагыз.

Whisper Large V3 стандарт бәяләүләрдә сүз хаталары 4.2% тәшкил итә. Реаль дөньяда дөреслек аудио сыйфатына, акцентка һәм телгә бәйле; тавышлы яки акцентлы язу өчен, WER ны берничә процентка арттырырга мөмкин.

Whisper Large V3 STT.ai-нең бушлай дәрәҗәсендә эшли — һәрбер кунак 600 минут / ай бушлай ала. түләүле планнар файлга озынрак чикләүләр, шәхси транскрипцияләр һәм приоритетлы чиратлаштыру өсти.

Whisper Large V3 MIT лицензиясе нигезендә чыгарыла, ул ачык чыганак лицензиясе. Сез Whisper Large V3-не үз җайланмагызда урнаштыра аласыз яки безнең урнаштырылган версияне куллана аласыз — икесе дә коммерцияле куллануга яраклы.

Whisper Large V3 99 телне яклый. Аудио өчен дөрес телне автоматик ачыклау сайлый; аны үзегезгә туры китереп тә билгеләп була, тик бу дөреслекне бераз арттыра.

Whisper Large V3 безнең GPUларда 8.0x реаль вакыт белән аудио эшкәртә. 1 сәгатьлек аудио файл 7 минут эчендә тәмамлана; озынрак файллар чиратка куела һәм эш тәмамлангач электрон почта аша хәбәр ителә.

Whisper Large V3дә 1.55B параметрлары бар. Зуррак модельләр төгәлрәк, ләкин зәгыйфьрәк; STT.ai Whisper Large V3не график процессорда урнаштыра, шуңа күрә параметрлар саны клиент ягы эшчәнлегенә йогынты ясамый.

Whisper Large V3 STT.ai тарафыннан якланган һәр форматны кабул итә — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI һәм башкалар.

Whisper Large V3 сүзлекнең һәрберсе өчен сөйләүче диаризациясе эшли — һәр сөйләүчегә тамга куела һәм соңрак редакторда аларны исемнәре үзгәртелә.

Әйе. Whisper Large V3 безнең идарә ителгән тирәлектә эшли — аудио эшкәртелә һәм юкка чыгарыла һәм ачыктан-ачык кушылмаусыз өйрәтү өчен беркайчан да кулланылмый. Про планнары клиент тарафыннан шифрлауны ялгыз трактовкаларга өсти.

Whisper Large V3не башка башка ярдәм ителгән модельләр белән бер үк аудиода чагыштыру өчен compare-stt инструментын кулланыгыз — сез WER, сегментлар саны, тавыш язучылары һәм ышанычлылык күрсәткечләрен бер-бер артлы күрерсез. Whisper Large V3 һәм Whisper Large V3 чагыштыруы иң еш кулланыла.

Әйе. /v1/transcribe ахыргы ноктасында модель параметры буларак "whisper-large-v3"не күрсәтегез. Python һәм Node.js SDKлары Whisper Large V3 мисалын кертәләр. Бушлай API катламы айга 100 минутны тәшкил итә.

Әйе. Whisper Large V3 MIT-лицензияләнгән булганлыктан, сез аны үзегез урнаштыра аласыз. STT.ai'ның ачык чыганаклы битендә проектның репо һәм авырлыклары күрсәтелгән. Продукция төркемнәре безнең урнаштырылган версияне GPU сатып алу, модель алмашу һәм опсларны калдыру өчен кулланалар.