Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ
Distil-Whisper ແມ່ນແບບຟອມການເວົ້າ-ເປັນ-ຂໍ້ຄວາມໂດຍ Hugging Face. STT.ai ເປັນເຈົ້າພາບ Distil-Whisper ຢູ່ໃນພື້ນຖານໂຄງລ່າງ GPU ຂອງພວກເຮົາ ສະນັ້ນທ່ານສາມາດໃຊ້ມັນໄດ້ໂດຍບໍ່ຕ້ອງໃຊ້ຮາດແວຂອງທ່ານເອງ - ສົ່ງສຽງຫຼືວິດີໂອແລະເລືອກ Distil-Whisper ຈາກຕົວເລືອກແບບ.
ສໍາລັບຄໍາຮ້ອງສະຫມັກທີ່ຕ້ອງການຄວາມຖືກຕ້ອງສູງ, Distil-Whisper ມີຄວາມຖືກຕ້ອງສູງກວ່າ WER ເຖິງ 100%. ສໍາລັບຄໍາຮ້ອງສະຫມັກທີ່ຕ້ອງການຄວາມຖືກຕ້ອງສູງກວ່າ WER, Distil-Whisper ມີຄວາມຖືກຕ້ອງສູງກວ່າ WER ເຖິງ 100%.
Distil-Whisper ແລ່ນໃນລະດັບຟຣີຂອງ STT.ai - ຜູ້ເຂົ້າຊົມທຸກຄົນໄດ້ຮັບ 600 ນາທີ / ເດືອນໂດຍບໍ່ເສຍຄ່າ. ແຜນທີ່ຈ່າຍເພີ່ມ ຈຳ ກັດຕໍ່ໄຟລ໌, ບົດບັນທຶກສ່ວນຕົວແລະການຈັດລຽງລໍາດັບຄວາມສໍາຄັນ.
Distil-Whisper ແມ່ນຖືກປ່ອຍອອກມາພາຍໃຕ້ MIT, ໃບອະນຸຍາດ Open Source ທີ່ອະນຸຍາດ. ທ່ານສາມາດເປັນເຈົ້າພາບ Distil-Whisper ເອງໃນຮາດແວຂອງທ່ານເອງຫຼືໃຊ້ເວີຊັນທີ່ເປັນເຈົ້າພາບຂອງພວກເຮົາ - ທັງສອງແມ່ນສາມາດໃຊ້ໄດ້ໃນທາງການຄ້າ.
Distil-Whisper ສະໜັບສະໜູນ 99 ພາສາ. ການກວດພົບອັດຕະໂນມັດ ເລືອກພາສາທີ່ຖືກຕ້ອງສຳລັບສຽງສ່ວນຫຼາຍ; ທ່ານຍັງສາມາດກຳນົດມັນດ້ວຍມືເພື່ອເພີ່ມຄວາມຖືກຕ້ອງໄດ້ເລັກນ້ອຍ.
Distil-Whisper ដំណើរការສຽງທີ່ປະມານ 48.0x ເວລາຈິງໃນ GPUs ຂອງພວກເຮົາ. ໄຟລ໌ສຽງ 1 ຊົ່ວໂມງ ສໍາເລັດໃນ 1 ນາທີ; ໄຟລ໌ທີ່ຍາວກວ່າລໍຖ້າແລະແຈ້ງເຕືອນໂດຍອີເມວເມື່ອເຮັດແລ້ວ.
Distil-Whisper ມີປາຣາມເຕີ 756M. ແບບທີ່ໃຫຍ່ກວ່າມີແນວໂນ້ມທີ່ຈະຖືກຕ້ອງກວ່າ ແຕ່ຊ້າກວ່າ; STT.ai ເປັນເຈົ້າພາບ Distil-Whisper ເທິງ GPU ສະນັ້ນການຄິດໄລ່ປາຣາມເຕີບໍ່ສົ່ງຜົນກະທົບຕໍ່ຜົນງານດ້ານຄລາສສິກຂອງທ່ານ.
Distil-Whisper ຮັບຮອງເອົາທຸກຮູບແບບ STT.ai ສະຫນັບສະຫນູນ - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ແລະອື່ນໆ. ຜົນຜະລິດເປັນ TXT, SRT, VTT, DOCX, JSON, ຫຼື PDF.
ຍິນດີ. ການຂຽນລາຍຊື່ຜູ້ເວົ້າຈະແລ່ນພ້ອມກັບ Distil-Whisper ສຳ ລັບທຸກໆການແປ - ຜູ້ເວົ້າແຕ່ລະຄົນມີស្លាກແລະທ່ານສາມາດປ່ຽນຊື່ພວກເຂົາໃນຕົວແກ້ໄຂຫຼັງຈາກນັ້ນ.
Distil-Whisper ແລ່ນໃນສະພາບແວດລ້ອມທີ່ໄດ້ຮັບການບໍລິຫານຂອງພວກເຮົາ - ສຽງແມ່ນຖືກປຸງແຕ່ງແລະລຶບໂດຍ default ແລະບໍ່ເຄີຍໃຊ້ສໍາລັບການຝຶກອົບຮົມໂດຍບໍ່ມີການ opt-in ຢ່າງຈະແຈ້ງ. ແຜນງານ Pro ເພີ່ມການເຂົ້າລະຫັດດ້ານລູກຄ້າສໍາລັບ transcripts ທີ່ພັກອາໄສ.
ໃຊ້ເຄື່ອງມືປຽບທຽບ-stt ເພື່ອແລ່ນ Distil-Whisper ຕ້ານກັບແບບອື່ນໆທີ່ໄດ້ຮັບການສະຫນັບສະຫນູນໃນສຽງດຽວກັນ - ທ່ານຈະເຫັນ WER, ຈໍານວນສ່ວນ, ຫມາຍເລກຜູ້ເວົ້າ, ແລະຄະແນນຄວາມໄວ້ວາງໃຈຂ້າງ-ໂດຍ-ຂ້າງ. Distil-Whisper versus Whisper Large V3 ການທຽບທຽບແມ່ນປົກກະຕິທີ່ສຸດແລ່ນ.
ຍິນດີ. ລະບຸ "distil-whisper" ເປັນຕົວແບບປາຣາມເຕີໃນ / v1 / transcribe endpoint. Python ແລະ Node.js SDKs ລວມມີຕົວຢ່າງ Distil-Whisper. ລະດັບ API ຟຣີລວມມີ 100 ນາທີ / ເດືອນ.
ຍິນດີ. ຍ້ອນວ່າ Distil-Whisper ແມ່ນ MIT- ໃບອະນຸຍາດ, ທ່ານສາມາດເປັນເຈົ້າພາບມັນໄດ້. STT.ai ເປີດແຫຼ່ງຫນ້າຂອງລາຍຊື່ໂຄງການ repo ແລະນ້ໍາຫນັກ. ທີມງານການຜະລິດສ່ວນໃຫຍ່ໃຊ້ເວີຊັນທີ່ເປັນເຈົ້າພາບຂອງພວກເຮົາເພື່ອຂ້າມການຊື້ GPU, ແບບຟອມ swaps, ແລະ ops.