Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ
SenseVoice ແມ່ນແບບຟອມການເວົ້າ-ເປັນ-ຂໍ້ຄວາມໂດຍ FunAudioLLM. STT.ai ເປັນເຈົ້າພາບ SenseVoice ຢູ່ໃນພື້ນຖານໂຄງລ່າງ GPU ຂອງພວກເຮົາ ສະນັ້ນທ່ານສາມາດໃຊ້ມັນໄດ້ໂດຍບໍ່ຕ້ອງໃຊ້ຮາດແວຂອງທ່ານເອງ - ສົ່ງສຽງຫຼືວິດີໂອແລະເລືອກ SenseVoice ຈາກຕົວເລືອກແບບ.
ສໍາລັບຄໍາຮ້ອງສະຫມັກທີ່ຕ້ອງການຄວາມຖືກຕ້ອງສູງ, SenseVoice ມີຄວາມຖືກຕ້ອງສູງກວ່າ WER ເຖິງ 100%. ສໍາລັບຄໍາຮ້ອງສະຫມັກທີ່ຕ້ອງການຄວາມຖືກຕ້ອງສູງກວ່າ WER, SenseVoice ມີຄວາມຖືກຕ້ອງສູງກວ່າ WER ເຖິງ 100%.
SenseVoice ແລ່ນໃນລະດັບຟຣີຂອງ STT.ai - ຜູ້ເຂົ້າຊົມທຸກຄົນໄດ້ຮັບ 600 ນາທີ / ເດືອນໂດຍບໍ່ເສຍຄ່າ. ແຜນທີ່ຈ່າຍເພີ່ມ ຈຳ ກັດຕໍ່ໄຟລ໌, ບົດບັນທຶກສ່ວນຕົວແລະການຈັດລຽງລໍາດັບຄວາມສໍາຄັນ.
SenseVoice ແມ່ນຖືກປ່ອຍອອກມາພາຍໃຕ້ MIT, ໃບອະນຸຍາດ Open Source ທີ່ອະນຸຍາດ. ທ່ານສາມາດເປັນເຈົ້າພາບ SenseVoice ເອງໃນຮາດແວຂອງທ່ານເອງຫຼືໃຊ້ເວີຊັນທີ່ເປັນເຈົ້າພາບຂອງພວກເຮົາ - ທັງສອງແມ່ນສາມາດໃຊ້ໄດ້ໃນທາງການຄ້າ.
SenseVoice ສະໜັບສະໜູນ 50 ພາສາ. ການກວດພົບອັດຕະໂນມັດ ເລືອກພາສາທີ່ຖືກຕ້ອງສຳລັບສຽງສ່ວນຫຼາຍ; ທ່ານຍັງສາມາດກຳນົດມັນດ້ວຍມືເພື່ອເພີ່ມຄວາມຖືກຕ້ອງໄດ້ເລັກນ້ອຍ.
SenseVoice ដំណើរការສຽງທີ່ປະມານ 50.0x ເວລາຈິງໃນ GPUs ຂອງພວກເຮົາ. ໄຟລ໌ສຽງ 1 ຊົ່ວໂມງ ສໍາເລັດໃນ 1 ນາທີ; ໄຟລ໌ທີ່ຍາວກວ່າລໍຖ້າແລະແຈ້ງເຕືອນໂດຍອີເມວເມື່ອເຮັດແລ້ວ.
SenseVoice ມີປາຣາມເຕີ 234M. ແບບທີ່ໃຫຍ່ກວ່າມີແນວໂນ້ມທີ່ຈະຖືກຕ້ອງກວ່າ ແຕ່ຊ້າກວ່າ; STT.ai ເປັນເຈົ້າພາບ SenseVoice ເທິງ GPU ສະນັ້ນການຄິດໄລ່ປາຣາມເຕີບໍ່ສົ່ງຜົນກະທົບຕໍ່ຜົນງານດ້ານຄລາສສິກຂອງທ່ານ.
SenseVoice ຮັບຮອງເອົາທຸກຮູບແບບ STT.ai ສະຫນັບສະຫນູນ - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ແລະອື່ນໆ. ຜົນຜະລິດເປັນ TXT, SRT, VTT, DOCX, JSON, ຫຼື PDF.
ຍິນດີ. ການຂຽນລາຍຊື່ຜູ້ເວົ້າຈະແລ່ນພ້ອມກັບ SenseVoice ສຳ ລັບທຸກໆການແປ - ຜູ້ເວົ້າແຕ່ລະຄົນມີស្លាກແລະທ່ານສາມາດປ່ຽນຊື່ພວກເຂົາໃນຕົວແກ້ໄຂຫຼັງຈາກນັ້ນ.
SenseVoice ແລ່ນໃນສະພາບແວດລ້ອມທີ່ໄດ້ຮັບການບໍລິຫານຂອງພວກເຮົາ - ສຽງແມ່ນຖືກປຸງແຕ່ງແລະລຶບໂດຍ default ແລະບໍ່ເຄີຍໃຊ້ສໍາລັບການຝຶກອົບຮົມໂດຍບໍ່ມີການ opt-in ຢ່າງຈະແຈ້ງ. ແຜນງານ Pro ເພີ່ມການເຂົ້າລະຫັດດ້ານລູກຄ້າສໍາລັບ transcripts ທີ່ພັກອາໄສ.
ໃຊ້ເຄື່ອງມືປຽບທຽບ-stt ເພື່ອແລ່ນ SenseVoice ຕ້ານກັບແບບອື່ນໆທີ່ໄດ້ຮັບການສະຫນັບສະຫນູນໃນສຽງດຽວກັນ - ທ່ານຈະເຫັນ WER, ຈໍານວນສ່ວນ, ຫມາຍເລກຜູ້ເວົ້າ, ແລະຄະແນນຄວາມໄວ້ວາງໃຈຂ້າງ-ໂດຍ-ຂ້າງ. SenseVoice versus Whisper Large V3 ການທຽບທຽບແມ່ນປົກກະຕິທີ່ສຸດແລ່ນ.
ຍິນດີ. ລະບຸ "sensevoice" ເປັນຕົວແບບປາຣາມເຕີໃນ / v1 / transcribe endpoint. Python ແລະ Node.js SDKs ລວມມີຕົວຢ່າງ SenseVoice. ລະດັບ API ຟຣີລວມມີ 100 ນາທີ / ເດືອນ.
ຍິນດີ. ຍ້ອນວ່າ SenseVoice ແມ່ນ MIT- ໃບອະນຸຍາດ, ທ່ານສາມາດເປັນເຈົ້າພາບມັນໄດ້. STT.ai ເປີດແຫຼ່ງຫນ້າຂອງລາຍຊື່ໂຄງການ repo ແລະນ້ໍາຫນັກ. ທີມງານການຜະລິດສ່ວນໃຫຍ່ໃຊ້ເວີຊັນທີ່ເປັນເຈົ້າພາບຂອງພວກເຮົາເພື່ອຂ້າມການຊື້ GPU, ແບບຟອມ swaps, ແລະ ops.