Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Заримдаа асуудаг асуултууд
Whisper Large V3 нь OpenAI-ийн ярианаас текст болгох загвар юм. STT.ai нь Whisper Large V3-ийг бидний график процессорын дэд бүтцэд байрлуулсан тул та өөрийнхөө тоног төхөөрөмжийг ашиглахгүйгээр ашиглаж болно. Аудио болон видеог татаж авч, загвар сонгогчоос Whisper Large V3-ийг сонгоно уу.
Стандарт үзүүлэлтээр Whisper Large V3 нь 4.2% үгийн алдааны түвшинг хангадаг. Үнэн хэрэгтээ энэ нь дууны чанар, өнгө, хэлнээс хамаарна. Хөгжим дуугарч байгаа үед WER-ийг хэд хэдэн хувь нэмэгдүүлэх хэрэгтэй.
Whisper Large V3 нь STT.ai-ийн үнэгүй түвшинд ажилладаг - бүх зочид 600 минут/сар үнэгүй авдаг. Үнэтэй төлөвлөгөө нь файл бүрийн урт хязгаар, хувийн бичлэг, болон нэн тэргүүний гүйлгээний жагсаалтыг нэмдэг.
Whisper Large V3 нь MIT, нээлттэй эхийн лицензийн дор гарсан. Та Whisper Large V3-ийг өөрийнхөө тоног төхөөрөмж дээр байршуулж эсвэл манай байршуулсан хувилбарыг ашиглаж болно. Хоёулаа худалдааны зориулалттай.
Whisper Large V3 нь 99 хэлийг дэмждэг. Автомат олж илрүүлэх нь олон аудиод тохирох хэлийг сонгоно. Та үүнийг гараараа тодорхойлж, бага зэрэг нарийвчлал нэмэгдүүлэх боломжтой.
Whisper Large V3 нь бидний GPU дээр 8.0x бодит цагаар аудиог боловсруулдаг. 1 цагийн аудио файл 7 минутын дотор дуусна; урт файлууд дараалалд орж дууссаны дараа имэйлээр мэдэгдэнэ.
Whisper Large V3 нь 1.55B параметртэй. Том загварууд илүү нарийвчлалтай боловч хурд багатай байдаг; STT.ai нь Whisper Large V3-ийг график процессор дээр байрлуулдаг тул параметрийн тоо нь таны клиентийн талд нөлөөлөхгүй.
Whisper Large V3 нь STT.ai-ийн дэмждэг бүх форматыг хүлээн авдаг - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, болон бусад. Түүний гаралт нь TXT, SRT, VTT, DOCX, JSON, эсвэл PDF.
Тийм ээ. Бүх бичлэгийн хувьд Whisper Large V3-тай хамт дуут дохионы тэмдэглэгээ хийгддэг. Бүх дуут дохионууд нь тэмдэглэгээтэй бөгөөд редакторт нэрийг нь өөрчилж болно.
Тийм. Whisper Large V3 нь бидний удирдсан орчинд ажилладаг — аудио нь урьдчилан боловсруулж устгагдсан бөгөөд тодорхой зөвшөөрөлгүйгээр хэзээ ч сургалтанд ашиглагддаггүй. Pro төлөвлөгөө нь хэвийн үед хадгалагдсан бичлэгийг клиентийн талд шифрлэдэг.
Whisper Large V3-ийг дэмждэг бусад загвартай харьцуулахад compare-stt хэрэгслийг ашиглана уу. Та WER, сегментийн тоо, дуут дохионы тэмдэг, найдвартай байдлын оноог хамтдаа харах болно. Whisper Large V3-ийг Whisper Large V3-тэй харьцуулах нь хамгийн түгээмэл хийгддэг.
Тийм. /v1/transcribe төгсгөлийн цэгт "whisper-large-v3" загварын параметрийг заана уу. Python болон Node.js SDK-д Whisper Large V3 жишээ багтсан. Үнэгүй API түвшин нь сарын 100 минутыг багтаасан.
Тийм ээ. Whisper Large V3 нь MIT лицензтэй тул та үүнийг өөрийнхөө сервер дээр байрлуулж болно. STT.ai-ийн нээлттэй эхийн хуудас нь төслийн репозитори болон жингүүдийг жагсаана. Ихэнх үйлдвэрлэлийн багууд бидний хостлагдсан хувилбарыг GPU худалдан авалт, загвар солилцоо, үйл ажиллагааг орхиход ашигладаг.