Transcribe with Whisper Large V3

ເຮັດວຽກ​ກັບ​ສຽງ ແລະ ວີດີໂອ​ທີ່​ມີ​ໃຫ້​ໃຊ້​ຮ່ວມກັນ. ເນື້ອໃນ​ທີ່​ຖືກ​ປົກປ້ອງ​ໂດຍ DRM ບໍ່​ຖືກ​ສະໜັບສະໜູນ.

ປັບປຸງ​ໃຫ້​ດີ​ຂຶ້ນ
Private transcript
ສົນທະນາ​ກັບ​ການ​ແປ
ປົດລັອກ​ດ້ວຍ​ Pro →
ຖີ້ມ​ໄຟລ໌​ຢູ່​ທີ່ນີ້ ຫຼື ກົດ​ເພື່ອ​ຄົ້ນຫາ
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - ເຖິງ 2GB
ປັບປຸງ​ໃຫ້​ດີ​ຂຶ້ນ
Private transcript
ສົນທະນາ​ກັບ​ການ​ແປ
ປົດລັອກ​ດ້ວຍ​ Pro →
ປັບປຸງ​ໃຫ້​ດີ​ຂຶ້ນ
ການບັນທຶກ & # 160; ៖ 0:00
ເວລາ​ຈິງ ແກ້ວ​ຝ້າຍ (ຊົ່ວຄາວ)
ເພີ່ມ​ປະສິດທິພາບ ສຽງ​ຊົ່ວ​ຄາວ (ຖືກຕ້ອງ)
ລິ້ງສາທາລະນະ: 24h, ພຽງແຕ່ຂໍ້ຄວາມ · ລົງທະບຽນ ສໍາລັບ 7d + ສຽງ · ມືອາຊີບ ສໍາລັບ​ການ​ເຊື່ອມ​ຕໍ່​ສ່ວນ​ຕົວ

ສຽງ​ເປັນ​ຂໍ້​ຄວາມ​ໃນ​ເວລາ​ຈິງ. AI ​ແກ້​ຂໍ້​ຜິດພາດ​ໂດຍ​ອັດຕະໂນມັດ​ເມື່ອ​ທ່ານ​ເວົ້າ - ຄວາມ​ຖືກຕ້ອງ​ຈະ​ດີ​ຂຶ້ນ​ເມື່ອ​ທ່ານ​ເວົ້າ​ດົນ​ກວ່າ.

ທົດສອບ​ໄມໂຄຣໂຟນ​ຂອງທ່ານ​ກ່ອນ
❤️ ຮັກ STT.ai? ເວົ້າກັບເພື່ອນຂອງທ່ານ!
​ທ່ານ​ໄດ້​ໃຊ້​ການ​ແປ​ຟຣີ​ຂອງທ່ານ​ແລ້ວ

ລົງທະບຽນສໍາລັບການຟຣີເພື່ອໄດ້ຮັບ 600 ນາທີ / ເດືອນ, ຫຼືປັບປຸງສໍາລັບ transcriptions ບໍ່ຈໍາກັດ.

10 ນາທີຟຣີ / ວັນ 600 ນາທີຟຣີກັບການລົງທະບຽນ ບໍ່ມີບັດເຄຣດິດ ຖືກ​ເຂົ້າລະຫັດ
ລົງທະບຽນຟຣີ →
4.2%
WER
99
Languages
8.0x
Speed
MIT
License

About Whisper Large V3

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

Whisper Large V3 ແມ່ນແບບຟອມການເວົ້າ-ເປັນ-ຂໍ້ຄວາມໂດຍ OpenAI. STT.ai ເປັນເຈົ້າພາບ Whisper Large V3 ຢູ່ໃນພື້ນຖານໂຄງລ່າງ GPU ຂອງພວກເຮົາ ສະນັ້ນທ່ານສາມາດໃຊ້ມັນໄດ້ໂດຍບໍ່ຕ້ອງໃຊ້ຮາດແວຂອງທ່ານເອງ - ສົ່ງສຽງຫຼືວິດີໂອແລະເລືອກ Whisper Large V3 ຈາກຕົວເລືອກແບບ.

ສໍາລັບຄໍາຮ້ອງສະຫມັກທີ່ຕ້ອງການຄວາມຖືກຕ້ອງສູງ, Whisper Large V3 ມີຄວາມຖືກຕ້ອງສູງກວ່າ WER ເຖິງ 100%. ສໍາລັບຄໍາຮ້ອງສະຫມັກທີ່ຕ້ອງການຄວາມຖືກຕ້ອງສູງກວ່າ WER, Whisper Large V3 ມີຄວາມຖືກຕ້ອງສູງກວ່າ WER ເຖິງ 100%.

Whisper Large V3 ແລ່ນໃນລະດັບຟຣີຂອງ STT.ai - ຜູ້ເຂົ້າຊົມທຸກຄົນໄດ້ຮັບ 600 ນາທີ / ເດືອນໂດຍບໍ່ເສຍຄ່າ. ແຜນທີ່ຈ່າຍເພີ່ມ ຈຳ ກັດຕໍ່ໄຟລ໌, ບົດບັນທຶກສ່ວນຕົວແລະການຈັດລຽງລໍາດັບຄວາມສໍາຄັນ.

Whisper Large V3 ແມ່ນຖືກປ່ອຍອອກມາພາຍໃຕ້ MIT, ໃບອະນຸຍາດ Open Source ທີ່ອະນຸຍາດ. ທ່ານສາມາດເປັນເຈົ້າພາບ Whisper Large V3 ເອງໃນຮາດແວຂອງທ່ານເອງຫຼືໃຊ້ເວີຊັນທີ່ເປັນເຈົ້າພາບຂອງພວກເຮົາ - ທັງສອງແມ່ນສາມາດໃຊ້ໄດ້ໃນທາງການຄ້າ.

Whisper Large V3 ສະໜັບສະໜູນ 99 ພາສາ. ການກວດພົບ​ອັດຕະໂນມັດ ເລືອກ​ພາສາ​ທີ່​ຖືກຕ້ອງ​ສຳລັບ​ສຽງ​ສ່ວນ​ຫຼາຍ; ທ່ານ​ຍັງ​ສາມາດ​ກຳນົດ​ມັນ​ດ້ວຍ​ມື​ເພື່ອ​ເພີ່ມ​ຄວາມ​ຖືກຕ້ອງ​ໄດ້​ເລັກ​ນ້ອຍ.

Whisper Large V3 ដំណើរការສຽງທີ່ປະມານ 8.0x ເວລາຈິງໃນ GPUs ຂອງພວກເຮົາ. ໄຟລ໌ສຽງ 1 ຊົ່ວໂມງ ສໍາເລັດໃນ 7 ນາທີ; ໄຟລ໌ທີ່ຍາວກວ່າລໍຖ້າແລະແຈ້ງເຕືອນໂດຍອີເມວເມື່ອເຮັດແລ້ວ.

Whisper Large V3 ມີ​ປາຣາມເຕີ 1.55B. ແບບທີ່ໃຫຍ່ກວ່າມີແນວໂນ້ມທີ່ຈະຖືກຕ້ອງກວ່າ ແຕ່ຊ້າກວ່າ; STT.ai ເປັນເຈົ້າພາບ Whisper Large V3 ເທິງ GPU ສະນັ້ນການຄິດໄລ່ປາຣາມເຕີບໍ່ສົ່ງຜົນກະທົບຕໍ່ຜົນງານດ້ານຄລາສສິກຂອງທ່ານ.

Whisper Large V3 ຮັບຮອງເອົາທຸກຮູບແບບ STT.ai ສະຫນັບສະຫນູນ - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ແລະອື່ນໆ. ຜົນຜະລິດເປັນ TXT, SRT, VTT, DOCX, JSON, ຫຼື PDF.

ຍິນດີ. ການຂຽນລາຍຊື່ຜູ້ເວົ້າຈະແລ່ນພ້ອມກັບ Whisper Large V3 ສຳ ລັບທຸກໆການແປ - ຜູ້ເວົ້າແຕ່ລະຄົນມີស្លាກແລະທ່ານສາມາດປ່ຽນຊື່ພວກເຂົາໃນຕົວແກ້ໄຂຫຼັງຈາກນັ້ນ.

Whisper Large V3 ແລ່ນໃນສະພາບແວດລ້ອມທີ່ໄດ້ຮັບການບໍລິຫານຂອງພວກເຮົາ - ສຽງແມ່ນຖືກປຸງແຕ່ງແລະລຶບໂດຍ default ແລະບໍ່ເຄີຍໃຊ້ສໍາລັບການຝຶກອົບຮົມໂດຍບໍ່ມີການ opt-in ຢ່າງຈະແຈ້ງ. ແຜນງານ Pro ເພີ່ມການເຂົ້າລະຫັດດ້ານລູກຄ້າສໍາລັບ transcripts ທີ່ພັກອາໄສ.

ໃຊ້ເຄື່ອງມືປຽບທຽບ-stt ເພື່ອແລ່ນ Whisper Large V3 ຕ້ານກັບແບບອື່ນໆທີ່ໄດ້ຮັບການສະຫນັບສະຫນູນໃນສຽງດຽວກັນ - ທ່ານຈະເຫັນ WER, ຈໍານວນສ່ວນ, ຫມາຍເລກຜູ້ເວົ້າ, ແລະຄະແນນຄວາມໄວ້ວາງໃຈຂ້າງ-ໂດຍ-ຂ້າງ. Whisper Large V3 versus Whisper Large V3 ການທຽບທຽບແມ່ນປົກກະຕິທີ່ສຸດແລ່ນ.

ຍິນດີ. ລະບຸ "whisper-large-v3" ເປັນຕົວແບບປາຣາມເຕີໃນ / v1 / transcribe endpoint. Python ແລະ Node.js SDKs ລວມມີຕົວຢ່າງ Whisper Large V3. ລະດັບ API ຟຣີລວມມີ 100 ນາທີ / ເດືອນ.

ຍິນດີ. ຍ້ອນວ່າ Whisper Large V3 ແມ່ນ MIT- ໃບອະນຸຍາດ, ທ່ານສາມາດເປັນເຈົ້າພາບມັນໄດ້. STT.ai ເປີດແຫຼ່ງຫນ້າຂອງລາຍຊື່ໂຄງການ repo ແລະນ້ໍາຫນັກ. ທີມງານການຜະລິດສ່ວນໃຫຍ່ໃຊ້ເວີຊັນທີ່ເປັນເຈົ້າພາບຂອງພວກເຮົາເພື່ອຂ້າມການຊື້ GPU, ແບບຟອມ swaps, ແລະ ops.