Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
សំណួរដែលសួរញឹកញាប់
Whisper Large V3 គឺជាម៉ូដែលនិយាយទៅអត្ថបទដោយ OpenAI ។ STT.ai hosts Whisper Large V3 on our GPU infrastructure ដូច្នេះអ្នកអាចប្រើវាដោយមិនចាំបាច់ផ្តល់នូវផ្នែករឹងផ្ទាល់ខ្លួនរបស់អ្នក - ផ្ទុកឡើងអូឌីយ៉ូឬវីដេអូហើយជ្រើស Whisper Large V3 ពីកម្មវិធីជ្រើសម៉ូដែល។
លើ ស្តង់ដារ គោលដៅ Whisper Large V3 សម្រេចបាន ជុំវិញ 4.2% អត្រា កំហុស ពាក្យ ។ ភាពត្រឹមត្រូវ ពិត ប្រាកដ ពិភពលោក អាស្រ័យ លើ គុណភាព អូឌីយ៉ូ សំឡេង រំខាន និង ភាសា សំឡេង រំខាន ឬ សំឡេង រំខាន រំពឹង ថា ពិន្ទុ ភាគរយ តិច ជាង WER ។
Whisper Large V3 រត់នៅលើ STT.ai កម្រិតឥតគិតថ្លៃ - អ្នកទស្សនាទាំងអស់ទទួលបាន 600 នាទី / ខែដោយគ្មានការចំណាយ។ ផែនការដែលបានបង់បន្ថែមដែនកំណត់ក្នុងមួយឯកសារបន្ថែមទៀត, ចម្លងឯកជននិងជួរអាទិភាព។
Whisper Large V3 ត្រូវបាន ចេញ ផ្សាយ ក្រោម MIT អាជ្ញាប័ណ្ណ ប្រភព បើកចំហ អនុញ្ញាត ។ អ្នក អាច ធ្វើ ម្ចាស់ ខ្លួន ឯង Whisper Large V3 លើ ផ្នែក រឹង របស់ អ្នក ឬ ប្រើ កំណែ ដែលបាន រៀបចំ របស់យើង — ទាំងពីរ គឺ អាច ប្រើ បាន ជា ពាណិជ្ជកម្ម ។
Whisper Large V3 គាំទ្រ 99 ភាសា & # 160; ។ ការរកឃើញដោយស្វ័យប្រវត្តិជ្រើសភាសាត្រឹមត្រូវសម្រាប់អូឌីយ៉ូភាគច្រើន & # 160; ។ អ្នកក៏អាចបញ្ជាក់វាដោយដៃសម្រាប់ការលើកភាពត្រឹមត្រូវតូចមួយ & # 160; ។
Whisper Large V3 ដំណើរការអូឌីយ៉ូនៅប្រហែល 8.0x ពេលវេលាពិតប្រាកដនៅលើ GPUs របស់យើង។ ឯកសារអូឌីយ៉ូ 1 ម៉ោងបញ្ចប់នៅក្រោម 7 នាទី; ឯកសារយូរជាងនេះជាជួរនិងជូនដំណឹងតាមរយៈអ៊ីម៉ែលនៅពេលធ្វើរួច។
Whisper Large V3 មានប៉ារ៉ាម៉ែត្រ 1.55B ។ ម៉ូដែលធំជាងគេមានទំនោរទៅជាត្រឹមត្រូវជាងមុន ប៉ុន្តែយឺតជាងមុន STT.ai ម៉ាស៊ីន Whisper Large V3 នៅលើ GPU ដូច្នេះការរាប់ប៉ារ៉ាម៉ែត្រមិនប៉ះពាល់ដល់ការប្រតិបត្តិផ្នែកម៉ាស៊ីនភ្ញៀវរបស់អ្នកទេ ។
Whisper Large V3 ទទួលយកទ្រង់ទ្រាយទាំងអស់ STT.ai គាំទ្រ - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, និងអ្នកដទៃទៀត. លទ្ធផលជា TXT, SRT, VTT, DOCX, JSON, ឬ PDF.
បាទ. កម្មវិធីសរសេរសំបុត្ររបស់អ្នកនិយាយរត់នៅជាប់គ្នា Whisper Large V3 សម្រាប់ការបកប្រែរាល់គ្នា - អ្នកនិយាយនីមួយៗមានស្លាកហើយអ្នកអាចប្ដូរឈ្មោះពួកគេក្នុងកម្មវិធីនិពន្ធបន្ទាប់មក & # 160; ។
បាទ. Whisper Large V3 រត់នៅក្នុងបរិស្ថានគ្រប់គ្រងរបស់យើង - អូឌីយ៉ូត្រូវបានដំណើរការនិងលុបដោយលំនាំដើមនិងមិនដែលប្រើសម្រាប់បណ្តុះបណ្តាលដោយគ្មានការជ្រើសចូលដោយផ្ទាល់។ ផែនការ Pro បន្ថែមការអ៊ិនគ្រីបផ្នែកអតិថិជនសម្រាប់អត្ថបទនៅសល់។
ប្រើឧបករណ៍ប្រៀបធៀប-stt ដើម្បីរត់ Whisper Large V3 ប្រឆាំងនឹងម៉ូដែលផ្សេងទៀតដែលគាំទ្រលើអូឌីយ៉ូដូចគ្នា - អ្នកនឹងឃើញ WER, រាប់ផ្នែក, ស្លាកអធិបតី, និងពិន្ទុទំនុកចិត្តខាងក្នុង-ដោយ-ខាងក្រៅ. Whisper Large V3 ប្រឆាំងនឹងការប្រៀបធៀប Whisper ធំ V3 គឺរត់ជាទូទៅបំផុត។
បាទ / ចាស។ បញ្ជាក់ "whisper-large-v3" ជាប៉ារ៉ាម៉ែត្រម៉ូដែលនៅលើ / v1 / transcribe endpoint ។ Python និង Node.js SDKs រួមបញ្ចូលឧទាហរណ៍ Whisper Large V3 ។ កម្រិត API ឥតគិតថ្លៃរួមបញ្ចូល 100 នាទី / ខែ ។
បាទ។ ដោយសារតែ Whisper Large V3 គឺជាអាជ្ញាប័ណ្ណ MIT អ្នកអាចរៀបចំវាដោយខ្លួនឯង។ ទំព័រប្រភពបើកចំហរបស់ STT.ai រាយបញ្ជីគម្រោង repo និងទំងន់។ ក្រុមផលិតកម្មភាគច្រើនប្រើកំណែដែលរៀបចំរបស់យើងដើម្បីរំលងការទិញ GPU ការផ្លាស់ប្តូរម៉ូដែលនិងប្រតិបត្តិការ។