Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ
Whisper Large V3 ແມ່ນແບບຟອມການເວົ້າ-ເປັນ-ຂໍ້ຄວາມໂດຍ OpenAI. STT.ai ເປັນເຈົ້າພາບ Whisper Large V3 ຢູ່ໃນພື້ນຖານໂຄງລ່າງ GPU ຂອງພວກເຮົາ ສະນັ້ນທ່ານສາມາດໃຊ້ມັນໄດ້ໂດຍບໍ່ຕ້ອງໃຊ້ຮາດແວຂອງທ່ານເອງ - ສົ່ງສຽງຫຼືວິດີໂອແລະເລືອກ Whisper Large V3 ຈາກຕົວເລືອກແບບ.
ສໍາລັບຄໍາຮ້ອງສະຫມັກທີ່ຕ້ອງການຄວາມຖືກຕ້ອງສູງ, Whisper Large V3 ມີຄວາມຖືກຕ້ອງສູງກວ່າ WER ເຖິງ 100%. ສໍາລັບຄໍາຮ້ອງສະຫມັກທີ່ຕ້ອງການຄວາມຖືກຕ້ອງສູງກວ່າ WER, Whisper Large V3 ມີຄວາມຖືກຕ້ອງສູງກວ່າ WER ເຖິງ 100%.
Whisper Large V3 ແລ່ນໃນລະດັບຟຣີຂອງ STT.ai - ຜູ້ເຂົ້າຊົມທຸກຄົນໄດ້ຮັບ 600 ນາທີ / ເດືອນໂດຍບໍ່ເສຍຄ່າ. ແຜນທີ່ຈ່າຍເພີ່ມ ຈຳ ກັດຕໍ່ໄຟລ໌, ບົດບັນທຶກສ່ວນຕົວແລະການຈັດລຽງລໍາດັບຄວາມສໍາຄັນ.
Whisper Large V3 ແມ່ນຖືກປ່ອຍອອກມາພາຍໃຕ້ MIT, ໃບອະນຸຍາດ Open Source ທີ່ອະນຸຍາດ. ທ່ານສາມາດເປັນເຈົ້າພາບ Whisper Large V3 ເອງໃນຮາດແວຂອງທ່ານເອງຫຼືໃຊ້ເວີຊັນທີ່ເປັນເຈົ້າພາບຂອງພວກເຮົາ - ທັງສອງແມ່ນສາມາດໃຊ້ໄດ້ໃນທາງການຄ້າ.
Whisper Large V3 ສະໜັບສະໜູນ 99 ພາສາ. ການກວດພົບອັດຕະໂນມັດ ເລືອກພາສາທີ່ຖືກຕ້ອງສຳລັບສຽງສ່ວນຫຼາຍ; ທ່ານຍັງສາມາດກຳນົດມັນດ້ວຍມືເພື່ອເພີ່ມຄວາມຖືກຕ້ອງໄດ້ເລັກນ້ອຍ.
Whisper Large V3 ដំណើរការສຽງທີ່ປະມານ 8.0x ເວລາຈິງໃນ GPUs ຂອງພວກເຮົາ. ໄຟລ໌ສຽງ 1 ຊົ່ວໂມງ ສໍາເລັດໃນ 7 ນາທີ; ໄຟລ໌ທີ່ຍາວກວ່າລໍຖ້າແລະແຈ້ງເຕືອນໂດຍອີເມວເມື່ອເຮັດແລ້ວ.
Whisper Large V3 ມີປາຣາມເຕີ 1.55B. ແບບທີ່ໃຫຍ່ກວ່າມີແນວໂນ້ມທີ່ຈະຖືກຕ້ອງກວ່າ ແຕ່ຊ້າກວ່າ; STT.ai ເປັນເຈົ້າພາບ Whisper Large V3 ເທິງ GPU ສະນັ້ນການຄິດໄລ່ປາຣາມເຕີບໍ່ສົ່ງຜົນກະທົບຕໍ່ຜົນງານດ້ານຄລາສສິກຂອງທ່ານ.
Whisper Large V3 ຮັບຮອງເອົາທຸກຮູບແບບ STT.ai ສະຫນັບສະຫນູນ - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ແລະອື່ນໆ. ຜົນຜະລິດເປັນ TXT, SRT, VTT, DOCX, JSON, ຫຼື PDF.
ຍິນດີ. ການຂຽນລາຍຊື່ຜູ້ເວົ້າຈະແລ່ນພ້ອມກັບ Whisper Large V3 ສຳ ລັບທຸກໆການແປ - ຜູ້ເວົ້າແຕ່ລະຄົນມີស្លាກແລະທ່ານສາມາດປ່ຽນຊື່ພວກເຂົາໃນຕົວແກ້ໄຂຫຼັງຈາກນັ້ນ.
Whisper Large V3 ແລ່ນໃນສະພາບແວດລ້ອມທີ່ໄດ້ຮັບການບໍລິຫານຂອງພວກເຮົາ - ສຽງແມ່ນຖືກປຸງແຕ່ງແລະລຶບໂດຍ default ແລະບໍ່ເຄີຍໃຊ້ສໍາລັບການຝຶກອົບຮົມໂດຍບໍ່ມີການ opt-in ຢ່າງຈະແຈ້ງ. ແຜນງານ Pro ເພີ່ມການເຂົ້າລະຫັດດ້ານລູກຄ້າສໍາລັບ transcripts ທີ່ພັກອາໄສ.
ໃຊ້ເຄື່ອງມືປຽບທຽບ-stt ເພື່ອແລ່ນ Whisper Large V3 ຕ້ານກັບແບບອື່ນໆທີ່ໄດ້ຮັບການສະຫນັບສະຫນູນໃນສຽງດຽວກັນ - ທ່ານຈະເຫັນ WER, ຈໍານວນສ່ວນ, ຫມາຍເລກຜູ້ເວົ້າ, ແລະຄະແນນຄວາມໄວ້ວາງໃຈຂ້າງ-ໂດຍ-ຂ້າງ. Whisper Large V3 versus Whisper Large V3 ການທຽບທຽບແມ່ນປົກກະຕິທີ່ສຸດແລ່ນ.
ຍິນດີ. ລະບຸ "whisper-large-v3" ເປັນຕົວແບບປາຣາມເຕີໃນ / v1 / transcribe endpoint. Python ແລະ Node.js SDKs ລວມມີຕົວຢ່າງ Whisper Large V3. ລະດັບ API ຟຣີລວມມີ 100 ນາທີ / ເດືອນ.
ຍິນດີ. ຍ້ອນວ່າ Whisper Large V3 ແມ່ນ MIT- ໃບອະນຸຍາດ, ທ່ານສາມາດເປັນເຈົ້າພາບມັນໄດ້. STT.ai ເປີດແຫຼ່ງຫນ້າຂອງລາຍຊື່ໂຄງການ repo ແລະນ້ໍາຫນັກ. ທີມງານການຜະລິດສ່ວນໃຫຍ່ໃຊ້ເວີຊັນທີ່ເປັນເຈົ້າພາບຂອງພວກເຮົາເພື່ອຂ້າມການຊື້ GPU, ແບບຟອມ swaps, ແລະ ops.