ဖြင့် ကူးယူ Whisper Large V3

Name: Whisper Large V3
Author: OpenAI

အများပြည်သူရရှိနိုင်အသံနှင့်ဗီဒီယိုနှင့်အတူအလုပ်လုပ်သည်။ DRM-ကာကွယ်ထားသောအကြောင်းအရာကိုထောက်ခံခြင်းမရှိပါ။

တိုးမြှင့်များအတွက်အဆင့်မြှင့်

ပုဂ္ဂလိက transcript

ဘာသာပြန်ချက်နှင့်အတူစကားပြော

Pro နှင့်အတူ Unlock →

ဖိုင်ကိုဒီနေရာမှာချလိုက် ဒါမှမဟုတ်ရှာဖွေဖို့နှိပ်ပါ

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — အထိ 2GB

ဖိုင်ပေါင်းများစွာကို တင်ပါ Pro နှင့်အတူ

တိုးမြှင့်များအတွက်အဆင့်မြှင့်

ပုဂ္ဂလိက transcript

ဘာသာပြန်ချက်နှင့်အတူစကားပြော

Pro နှင့်အတူ Unlock →

တိုးမြှင့်များအတွက်အဆင့်မြှင့်

စာသားသို့အစစ်အမှန်အချိန်စကားပြော. AI သင်ပြောသလိုအလိုအလျောက်-ပြင်ဆင် - တိကျမှုပိုမိုကြာရှည်စကားပြောနှင့်အတူတိုးတက်လာသည်။

ပထမဆုံး သင့်မိုက်ခရိုဖုန်းကို စမ်းသပ်ပါ

10 အခမဲ့မိနစ် / ရက် 600 min signup နှင့်အတူအခမဲ့ ငွေပေးချေမှုကဒ်မရှိ လျှို့ဝှက်ချက် ထိန်းထားသည်

အခမဲ့ Sign Up →

4.2%

WER

ဘာသာစကားများ

8.0x

အမြန်နှုန်း

MIT

လိုင်စင်

အကြောင်း Whisper Large V3

Whisper Large V3 သည် OpenAI ၏ ခေတ်မီသော ပွင့်လင်းသော ရင်းမြစ် စကားပြော အသိအမှတ်ပြု နည်းစနစ် ဖြစ်သည်။ 1.55 ဘီလီယံ parameters များဖြင့် 99 ဘာသာစကားများ ကျော် ထူးခြားသော တိကျမှု ပေးစွမ်းနိုင်သည်။ ဘာသာစကားပေါင်းစုံ 680,000 နာရီ အသံဒေတာများ အပေါ် လေ့ကျင့်ထားသော transformer encoder-decoder architecture ကို အသုံးပြုသည်။

ဘာသာစကားများထောက်ခံ Whisper Large V3

အင်္ဂလိပ်

စပိန်

ပြင်သစ်

ဂျာမန်

တရုတ်

ဂျပန်

ကိုရီးယား

ပေါ်တူဂီ

အာရဗီ

ဟိန္ဒီ

ရုရှ

အီတလီ

ဒတ်ခ်ျ

တူရကီ

ပိုလန်

ဆွီဒင်

အင်ဒိုနီးရှား

ထိုင်း

ဗီယက်နမ်

ချက်

ဂရိ

ရိုမေနီယား

ဟန်ဂေရီ

ဟီဘရူး

ဒိန်းမတ်

ဖင်လန်

နော်ဝေ

ယူကရိန်း

မလေး

ဘင်္ဂါလီ

မော်ဒယ် အချက်အလက်

ပေးသွင်းသူOpenAI
ဗိသုကာပညာ-
လိုင်စင်MIT
ပြုပြင်ပြောင်းလဲမှုMar 2026

ဆက်စပ်မော်ဒယ်များ

3.2% WER

5.1% WER

3.5% WER

7.8% WER

3.0% WER

မေးလေ့ရှိသောမေးခွန်းများ

STT.ai Whisper Large V3 အားဖြင့်စကားပြော-to-text မော်ဒယ်ဖြစ်ပါသည် OpenAI. STT.ai Whisper Large V3 ကျွန်တော်တို့ရဲ့ GPU အခြေခံအဆောက်အအုံအပေါ် hosts ဒါကြောင့်သင်သည်သင်၏ကိုယ်ပိုင် hardware ကိုprovisioning မပါဘဲအသုံးပြုနိုင်ပါတယ် - အသံသို့မဟုတ်ဗီဒီယိုကို upload လုပ်ပြီးမော်ဒယ် picker မှ Whisper Large V3 ကို pick.

စံ benchmarks အပေါ်, Whisper Large V3 ပတ်လည် 4.2% Word ကိုအမှားနှုန်းကိုရရှိသည်။ အစစ်အမှန်ကမ္ဘာ့တိကျမှန်ကန်မှုအသံအရည်အသွေး, အသံထွက်, နှင့်ဘာသာစကားပေါ်တွင်မူတည်သည်။ မြည်တမ်းသို့မဟုတ်အသံထွက်မှတ်တမ်းတင်မှုများအတွက်, အနည်းငယ်ရာခိုင်နှုန်းအဆင့်မြင့် WER မျှော်လင့်ပါ။

Whisper Large V3 STT.ai ၏အခမဲ့အဆင့်အပေါ် runs - အားလုံးဧည့်သည်များရ 600 မိနစ်များအခမဲ့စတင်ရန်။ ပေးချေပရောဂျက်ပိုမိုကြာရှည် per-file ကိုကန့်သတ်ချက်များ, ပုဂ္ဂလိက transcripts, နှင့်အလေးပေးတန်းစီထည့်သွင်းပါ။

Whisper Large V3 MIT, ခွင့်ပြုချက်ပေးသော open-source လိုင်စင်အောက်တွင်ထုတ်ဝေသည်။ သင်သည်သင်၏ကိုယ်ပိုင် hardware ပေါ်တွင် Whisper Large V3 ကိုကိုယ်ပိုင်-host သို့မဟုတ်ကျွန်ုပ်တို့၏ host ကိုဗားရှင်းကိုအသုံးပြုနိုင်သည် - နှစ်ဦးစလုံးကုန်သွယ်ရေးအတွက်အသုံးပြုနိုင်သည်။

Whisper Large V3 supports 99 languages. Auto-detection အများဆုံး audio အတွက်မှန်ကန်သောဘာသာစကားကို picks; သင်သည်လည်းအသေးစားတိကျမှု lift အတွက်လက်ဖြင့်သတ်မှတ်နိုင်သည်.

Whisper Large V3 အကြောင်းကိုကျွန်တော်တို့ရဲ့ GPUs အပေါ် 8.0x အစစ်အမှန်အချိန်တွင်အသံကိုစီမံခန့်ခွဲ. 1-နာရီအသံဖိုင်အောက်တွင်ပြီးဆုံး 7 မိနစ်; ပိုမိုကြာရှည်ဖိုင်များကိုတန်းစီပြီးပြီးဆုံးသောအခါအီးမေးလ်ဖြင့်အသိပေး.

Whisper Large V3 1.55B parameters တွေကိုရှိပါတယ်. ကြီးမားတဲ့မော်ဒယ်များပိုမိုတိကျပေမယ့်နှေးဖြစ်လွယ်သည်။ STT.ai GPU ပေါ်တွင် Whisper Large V3 hosts ဒါကြောင့် parameter count သင့်ရဲ့ client-side performance ကိုသက်ရောက်မှုမရှိပါ။

Whisper Large V3 အားလုံး format ကိုလက်ခံ STT.ai ထောက်ခံမှု - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, နှင့်အခြားသူများ. TXT အဖြစ် output ကို, SRT, VTT, DOCX, JSON, သို့မဟုတ် PDF ကို.

ဟုတ်ကဲ့. Speaker diarization အတူတကွ runs Whisper Large V3 အားလုံး transcription အတွက် — တစ်ခုချင်းစီကို speaker ကို label လုပ်ထားပြီးသင်နောက်ပိုင်းတွင် editor မှာသူတို့ကို rename လုပ်နိုင်ပါတယ်.

ဟုတ်ကဲ့. Whisper Large V3 ကျွန်တော်တို့ရဲ့စီမံခန့်ခွဲမှုပတ်ဝန်းကျင်တွင် runs — audio ကို processed နှင့် default အားဖြင့်ဖျက်သိမ်းပြီးရှင်းလင်း opt-in မပါဘဲလေ့ကျင့်ရေးအတွက်မသုံးပါ. Pro စီမံကိန်းများအနားယူ transcrites အတွက် client-side encryption ကို add.

Whisper Large V3 တူညီတဲ့အသံအပေါ်အခြားမည်သည့်ထောက်ခံမှုမော်ဒယ်ကိုဆန့်ကျင် run ရန်နှိုင်းယှဉ်-STT tool ကိုအသုံးပြုပါ - သင် WER ကိုမြင်ရလိမ့်မယ်, segment ကိုစာရင်း, speaker labels, နှင့်ဘေးချင်းယှဉ်ယုံကြည်မှုရမှတ်များ. အဆိုပါ Whisper Large V3 versus Whisper ကြီးမားသော V3 နှိုင်းယှဉ်မှုအများဆုံးအများအားဖြင့် run ဖြစ်ပါတယ်။

ဟုတ်ကဲ့။ / v1 / transcribe endpoint ပေါ်တွင်မော်ဒယ် parameter ကိုအဖြစ် "whisper-large-v3" ကိုသတ်မှတ်ပါ။ Python နှင့် Node.js SDKs Whisper Large V3 ဥပမာများပါဝင်သည်။ အခမဲ့ API tier ပါဝင်သည် 100 မိနစ် / လ။

ဟုတ်ကဲ့။ Whisper Large V3 သည် MIT-လိုင်စင်ရသောကြောင့်သင်ကိုယ်တိုင်၎င်းကို host လုပ်နိုင်သည်။ STT.ai ၏ open-source စာမျက်နှာသည်ပရောဂျက် repo နှင့်အလေးချိန်များကိုစာရင်းပြုစုသည်။ အများစုမှာထုတ်လုပ်မှုအဖွဲ့များသည် GPU ထောက်ပံ့ရေး၊ မော်ဒယ် swaps နှင့် ops ကိုကျော်လွှားရန်ကျွန်ုပ်တို့၏ hosted version ကိုအသုံးပြုသည်။

ဖြင့် ကူးယူ Whisper Large V3

အကြောင်း Whisper Large V3

ဘာသာစကားများထောက်ခံ Whisper Large V3

မော်ဒယ် အချက်အလက်

ဆက်စပ်မော်ဒယ်များ

မေးလေ့ရှိသောမေးခွန်းများ

Whisper Large V3 ဆိုတာဘာလဲ?

Whisper Large V3 ဆိုတာဘယ်လောက်တိကျသလဲ?

Whisper Large V3 ကိုအသုံးပြုရန်အခမဲ့ဖြစ်ပါသလား?

Whisper Large V3 အသုံးပြုသည်မည်သည့်လိုင်စင်?

Whisper Large V3 ထောက်ခံမှုဘယ်လောက်ဘာသာစကားများရှိသလဲ?

Whisper Large V3 ဘယ်လောက်မြန်လဲ?

Whisper Large V3 အမျိုးအစားဘယ်လောက်ကြီးလဲ?

Whisper Large V3 transcribe နိုင်ပါတယ်ဘာအသံဖိုင်ပုံစံများ?

Whisper Large V3 အမျိုးမျိုးသောပြောဆိုသူတွေကိုရှာဖွေတွေ့ရှိပါသလား?

Whisper Large V3 ကိုအသုံးပြုသောအခါကျွန်ုပ်၏ဒေတာသည်ပုဂ္ဂလိကဖြစ်ပါသလား?

Whisper Large V3 အခြား STT မော်ဒယ်များသို့နှိုင်းယှဉ်ဘယ်လိုလဲ?

ငါ API ကိုမှတဆင့် Whisper Large V3 ကိုအသုံးပြုနိုင်သလား?

ငါငါ့ကိုယ်ပိုင်ဆာဗာပေါ်တွင် Whisper Large V3 Run နိုင်သလား?