Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
မေးလေ့ရှိသောမေးခွန်းများ
STT.ai Whisper Large V3 အားဖြင့်စကားပြော-to-text မော်ဒယ်ဖြစ်ပါသည် OpenAI. STT.ai Whisper Large V3 ကျွန်တော်တို့ရဲ့ GPU အခြေခံအဆောက်အအုံအပေါ် hosts ဒါကြောင့်သင်သည်သင်၏ကိုယ်ပိုင် hardware ကိုprovisioning မပါဘဲအသုံးပြုနိုင်ပါတယ် - အသံသို့မဟုတ်ဗီဒီယိုကို upload လုပ်ပြီးမော်ဒယ် picker မှ Whisper Large V3 ကို pick.
စံ benchmarks အပေါ်, Whisper Large V3 ပတ်လည် 4.2% Word ကိုအမှားနှုန်းကိုရရှိသည်။ အစစ်အမှန်ကမ္ဘာ့တိကျမှန်ကန်မှုအသံအရည်အသွေး, အသံထွက်, နှင့်ဘာသာစကားပေါ်တွင်မူတည်သည်။ မြည်တမ်းသို့မဟုတ်အသံထွက်မှတ်တမ်းတင်မှုများအတွက်, အနည်းငယ်ရာခိုင်နှုန်းအဆင့်မြင့် WER မျှော်လင့်ပါ။
Whisper Large V3 STT.ai ၏အခမဲ့အဆင့်အပေါ် runs - အားလုံးဧည့်သည်များရ 600 မိနစ် / လအခမဲ့. ပေးဆောင်အစီအစဉ်များပိုမိုကြာရှည် per-file ကိုကန့်သတ်ချက်များ, ပုဂ္ဂလိက transcripts, နှင့်အလေးပေးတန်းစီထည့်သွင်း.
Whisper Large V3 MIT, ခွင့်ပြုချက်ပေးသော open-source လိုင်စင်အောက်တွင်ထုတ်ဝေသည်။ သင်သည်သင်၏ကိုယ်ပိုင် hardware ပေါ်တွင် Whisper Large V3 ကိုကိုယ်ပိုင်-host သို့မဟုတ်ကျွန်ုပ်တို့၏ host ကိုဗားရှင်းကိုအသုံးပြုနိုင်သည် - နှစ်ဦးစလုံးကုန်သွယ်ရေးအတွက်အသုံးပြုနိုင်သည်။
Whisper Large V3 supports 99 languages. Auto-detection အများဆုံး audio အတွက်မှန်ကန်သောဘာသာစကားကို picks; သင်သည်လည်းအသေးစားတိကျမှု lift အတွက်လက်ဖြင့်သတ်မှတ်နိုင်သည်.
Whisper Large V3 အကြောင်းကိုကျွန်တော်တို့ရဲ့ GPUs အပေါ် 8.0x အစစ်အမှန်အချိန်တွင်အသံကိုစီမံခန့်ခွဲ. 1-နာရီအသံဖိုင်အောက်တွင်ပြီးဆုံး 7 မိနစ်; ပိုမိုကြာရှည်ဖိုင်များကိုတန်းစီပြီးပြီးဆုံးသောအခါအီးမေးလ်ဖြင့်အသိပေး.
Whisper Large V3 1.55B parameters တွေကိုရှိပါတယ်. ကြီးမားတဲ့မော်ဒယ်များပိုမိုတိကျပေမယ့်နှေးဖြစ်လွယ်သည်။ STT.ai GPU ပေါ်တွင် Whisper Large V3 hosts ဒါကြောင့် parameter count သင့်ရဲ့ client-side performance ကိုသက်ရောက်မှုမရှိပါ။
Whisper Large V3 အားလုံး format ကိုလက်ခံ STT.ai ထောက်ခံမှု - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, နှင့်အခြားသူများ. TXT အဖြစ် output ကို, SRT, VTT, DOCX, JSON, သို့မဟုတ် PDF ကို.
ဟုတ်ကဲ့. Speaker diarization အတူတကွ runs Whisper Large V3 အားလုံး transcription အတွက် — တစ်ခုချင်းစီကို speaker ကို label လုပ်ထားပြီးသင်နောက်ပိုင်းတွင် editor မှာသူတို့ကို rename လုပ်နိုင်ပါတယ်.
ဟုတ်ကဲ့. Whisper Large V3 ကျွန်တော်တို့ရဲ့စီမံခန့်ခွဲမှုပတ်ဝန်းကျင်တွင် runs — audio ကို processed နှင့် default အားဖြင့်ဖျက်သိမ်းပြီးရှင်းလင်း opt-in မပါဘဲလေ့ကျင့်ရေးအတွက်မသုံးပါ. Pro စီမံကိန်းများအနားယူ transcrites အတွက် client-side encryption ကို add.
Whisper Large V3 တူညီတဲ့အသံအပေါ်အခြားမည်သည့်ထောက်ခံမှုမော်ဒယ်ကိုဆန့်ကျင် run ရန်နှိုင်းယှဉ်-STT tool ကိုအသုံးပြုပါ - သင် WER ကိုမြင်ရလိမ့်မယ်, segment ကိုစာရင်း, speaker labels, နှင့်ဘေးချင်းယှဉ်ယုံကြည်မှုရမှတ်များ. အဆိုပါ Whisper Large V3 versus Whisper ကြီးမားသော V3 နှိုင်းယှဉ်မှုအများဆုံးအများအားဖြင့် run ဖြစ်ပါတယ်။
ဟုတ်ကဲ့။ / v1 / transcribe endpoint ပေါ်တွင်မော်ဒယ် parameter ကိုအဖြစ် "whisper-large-v3" ကိုသတ်မှတ်ပါ။ Python နှင့် Node.js SDKs Whisper Large V3 ဥပမာများပါဝင်သည်။ အခမဲ့ API tier ပါဝင်သည် 100 မိနစ် / လ။
ဟုတ်ကဲ့။ Whisper Large V3 သည် MIT-လိုင်စင်ရသောကြောင့်သင်ကိုယ်တိုင်၎င်းကို host လုပ်နိုင်သည်။ STT.ai ၏ open-source စာမျက်နှာသည်ပရောဂျက် repo နှင့်အလေးချိန်များကိုစာရင်းပြုစုသည်။ အများစုမှာထုတ်လုပ်မှုအဖွဲ့များသည် GPU ထောက်ပံ့ရေး၊ မော်ဒယ် swaps နှင့် ops ကိုကျော်လွှားရန်ကျွန်ုပ်တို့၏ hosted version ကိုအသုံးပြုသည်။